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Prefácio 


Ao chegar em Shefheld, no segundo semestre 
de 1990 para fazer um doutorado em Identi- 
ficação de Sistemas sob a orientação do Prof. 
Stephen Billings, este me propôs investigar- 
mos a identificação de sistemas com diná- 
mica caótica. Assim, não é exagero dizer que 
meu envolvimento com dinâmica não linear e 
identificação de sistemas tem a mesma idade 
e receberam da minha parte praticamente a 
mesma dedicação. 


Por questões históricas, comecei à escre- 
ver um livro texto sobre identificação de sis- 


temas em 1995. Até o ano 2000, quando a 
primeira edição do livro Introdução à Identi- 
ficação de Sistemas foi publicado, dediquei- 
me a essa tarefa, tanto no ensino de pós- 
graduação quanto à organização e transcri- 
ção das notas de aula. 


No primeiro semestre de 2002, lecionei 
a disciplina Introdução aos Sistemas Diná- 
micos Não Lineares para estudantes de pós- 
graduação no PPGEE-UFMG pela primeira 
vez. Esse foi o ponto de partida da presente 
obra. (Quase vinte anos depois, sem qual- 
quer surpresa, constato que o texto perma- 
nece inacabado. Considero os primeiros cinco 
capítulos terminados, ao menos do ponto de 
vista “operacional”. O estado dos demais ca- 
pítulos é mais heterogêneo, sendo que algu- 
mas partes receberam pouca atenção ainda. 


Um dos eventos que ocorreram nesses úl- 
timos vinte anos foi o surgimento de meca- 
nismos de self-publishing. Com essa opor- 


tunidade e incentivado pela perspectiva de 
ter que lecionar a disciplina de forma remota 
devido à pandemia do corona vírus, resolvi 
“juntar os trapos” e disponibilizar o material 
como se encontra. 


O livro está sendo composto e diagra- 
mado pensando numa versão impressa. À fim 
de oferecer ao leitor uma alternativa em for- 
mato eletrônico, optou-se por preparar uma 
versão Kindle. Para garantir que o conteúdo 
de ambas as versões seja o mesmo, foi ne- 
cessário abrir mão de uma diagramação mais 
elegante para a versão Kindle. 


O livro tem como público alvo alunos 
de pós-graduação, mas pode ser usado como 
texto em disciplinas mais avançadas em ní- 
vel de graduação. Partes deste volume po- 
dem ser cobertos em disciplinas de 60 horas 
de aula. Esse tempo não é suficiente para 
cobrir todo o material. 


Alguns exemplos podem ser utilizados 


como tarefas de simulação a serem realizadas 
em sala de aula. Ao fim de cada capítulo são 
apresentados exercícios e tarefas computaci- 
onais que, ao longo de semestres de ensino, 
têm se mostrado úteis em ajudar os estudan- 
tes a fixar os conceitos que são, via de regra, 
bastante abstratos. 


Os pré-requisitos incluem conceitos de 
equações diferenciais ordinárias, sistemas di- 
nâmicos lineares no domínio do tempo. A 
abordagem seguida no livro procura o difícil 
equilíbrio entre conceitos abstratos e ques- 
tões com as quais nos defrontamos em situ- 
ações práticas. Fica a cargo de cada leitor 
avaliar o nível de sucesso alcançado nesse es- 
forço. 


O livro está dividido em duas partes. Na 
primeira, que é a parte mais madura, são 
apresentados alguns dos principais conceitos 
a serem usados ao longo da obra. O objetivo 
também é fornecer ao leitor uma base con- 


ceitual para ler artigos e trabalhos técnico- 
científicos na área. Na segunda parte são des- 
critos algoritmos e procedimentos para aná- 
lise e modelagem de sistemas dinâmicos a 
partir de dados. Uma exceção é o Capítulo 10 
que é uma rápida (e inacabada) introdução 
ao controle e sincronismo de osciladores não 
lineares e, por vezes, caóticos. 


O Capítulo 1 apresenta uma rápida revi- 
são de alguns pontos da teoria de sistemas 
dinâmicos contínuos. O objetivo deste capí- 
tulo é prover nomenclatura e conceitos bá- 
sicos que serão necessários no restante do li- 
vro. Em particular menciona-se o conceito de 
campos vetoriais em espaço de estados, solu- 
ções e condições iniciais, pontos fixos e sua 
estabilidade, alguns aspectos básicos sobre 
equivalência topológica de soluções são apre- 
sentados, linearização, estabilidade de Liapu- 
nov e comportamento assintótico. 


O Capítulo 2 é análogo ao Capítulo 1, 


mas para mapas. Ao longo do livro será feita 
distinção entre a discretização temporal de 
um fluxo e mapas. Tanto um como o outro 
são representações em tempo discreto, mas 
seu uso e interpretação são distintos. O Ca- 
pítulo 2 refere-se a mapas. Os conceitos tra- 
tados incluem, soluções, gráficos de teia, pon- 
tos invariantes e pontos fixos de mapas e sua 
estabilidade. 


O Capítulo 3 é dedicado ao estudo de al- 
gumas bifurcações de pontos fixos tanto de 
fluxos como de mapas. As bifurcações es- 
tudadas são fenômenos de perda de estabi- 
lidade estrutural de campos vetoriais — con- 
ceito introduzido no Capítulo 1 — à medida 
que um parâmetro, chamado de parâmetro 
de bifurcação é variado. Algumas bifurca- 
ções globais são rapidamente abordadas ao 
final do capítulo, que termina com a análise 
do sistema de Lorenz e do mapa logístico. 


O Capítulo 4 começa tratando de soluções 


assintóticas que não são valores constantes no 
tempo, mas oscilatórias. À título de motiva- 
ção, menciona-se a bifurcação de ciclos. Isso 
serve de base para tratar da amostragem de 
Poincaré, que permite traçar uma útil equi- 
valência entre fluxos e mapas dinâmicos. Os 
importantes conceitos de seção de Poincaré 
e mapa de primeiro retorno são apresenta- 
dos nesse capítulo, que termina mencionando 
atratores estranhos e caóticos. 


Tendo introduzido ao leitor o conceito de 
atrator estranho no Capítulo 4, o Capítulo 5 
prossegue usando indicadores “clássicos” para 
a caracterização de tais atratores. Muitos 
dos referidos indicadores têm valor concei- 
tual importante, apesar de que nem todos são 
mais usados na caracterização de atratores. 
Em particular, são apresentados os expoen- 
tes de Liapunov, entropia e dimensão fractal. 


O problema da reconstrução do espaço de 
estados a partir de uma variável medida é dis- 


cutido no Capítulo 6. O caso multivariável 
em que a reconstrução é feita com um con- 
junto de variáveis, menor que a dimensão do 
espaço, também é brevemente mencionado 
nesse capítulo, que termina com a discussão 
de como escolher os parâmetros de imersão 
para o caso de coordenadas de atraso. 


Há dois capítulos que foram escritos com 
base em trabalhos de cunho mais amplo e que 
estão mais próximos de atingirem “o estado 
estacionário” — ou o conjunto limite-w, como 
chamado em dinâmica não linear. O Capí- 
tulo 7 trata de maneira mais formal o pro- 
blema de observabilidade de dinâmica não 
linear. Esse assunto é construído ao longo 
do livro, mas no Capítulo 7 é feita uma ex- 
posição mais completa. O capítulo descreve 
alguns resultados desenvolvidos pelo autor 
desde 1995, muitos deles alcançados com o 
colega e amigo Christophe Letellier. Tam- 
bém o Capítulo 9 faz uma revisão sobre o 


assunto de modelagem a partir de dados de 
sistemas com dinâmica caótica, tema esse in- 
vestigado pelo autor especialmente na década 
de 1990. Os resultados relacionados à mode- 
lagem podem ser encontrados na literatura 
citada. Portanto a leitura dos capítulos 7 e 9 
deve ser suficiente para dar ao estudante uma 
visão global do tema e as principais aborda- 
gens na literatura. 


O Capítulo 8 trata de duas técnicas de 
análise de séries temporais. Em primeiro lu- 
gar, discute-se brevemente o método de da- 
dos subrogados. As três etapas principais são 
pontuadas, a saber: a definição de uma hi- 
pótese nula, a geração de dados subrogados 
e a definição de uma estatística que permita 
realizar o teste de hipóteses. Em segundo 
lugar, o capítulo trata de gráficos de recor- 
rência. O caso de recorrência cruzada e con- 
junta são mencionados. Os elementos bási- 
cos da quantificação de gráficos de recorrên- 


cia (RQA, do inglês recurrence quantification 
analysis) também é abordada brevemente. O 
capítulo encerra com um estudo de caso de- 
senvolvido com o uso de gráficos de recorrên- 
cia. 

Ao longo dos próximos semestres, à me- 
dida que lecionar o tema, pretendo gradual- 
mente completar as principais lacunas. 

Alguns scripts em Matlab que tratam de 
temas abordados neste livro podem ser en- 
contrados em 


https: //www.researchgate.net /project /Scripts- 
on-Nonlinear-Dynamics 


Ao longo dos anos tive a feliz oportuni- 
dade de interagir e aprender sobre este tema 
com pesquisadores e estudantes. Dentre os 
pesquisadores menciono Christophe Letellier 
e Luiz Monteiro. Apesar de interagir me- 
nos, meu contato com Marcelo Savi sempre 
foi muito positivo e seus livros são de ajuda. 
O companheirismo de Eduardo Mendes é um 
motivo de satisfação e aprendizado, desde a 
época do mestrado em vários temas, inclusive 
dinâmica não linear. 


Dentre estudantes (hoje colegas) com 
quem muito aprendi sobre dinâmica não li- 
near, cito Giovani Rodrigues, Leonardo Tór- 
res, Erivelton Nepomuceno, Marcelo Corrêa, 
Álvaro Polati de Souza, Ubiratan Freitas, 
Edgar Furtado, Gleison Amaral, Leonardo 
Portes, Leandro Freitas, Arthur Montanari 
e Gustavo Salgado, a quem agradeço pela 
leitura crítica de uma versão do texto. Sou 
grato a inúmeros estudantes que contribuí- 


ram sugestões e correções ao texto. 

Agradeço a Deus pela Sua infinita graça 
e salvação na Pessoa de Seu Filho, à minha 
esposa Janete e filhas Priscila, Nerissa e Pau- 
line, pela constante e mui agradável compa- 
nhia. 


Luis Antonio Aguirre 
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Parte I 


Conceitos 


Capítulo 1 


Sistemas Dinâmicos 
Contínuos 


Este capítulo apresenta uma rápida revisão 
de alguns pontos da teoria de sistemas di- 
nâmicos em tempo contínuo. O objetivo é 
prover nomenclatura e conceitos básicos usa- 
dos no restante do livro. Ao final do capítulo, 
são indicadas diversas referências que abor- 


dam o assunto de maneira mais minuciosa e 


detalhada. 


1.1 Órbitas e Espaço 
de Fases 


Ao rever algumas definições básicas de siste- 
mas dinâmicos, a ênfase na presente seção é 
a solução de equações diferenciais e sua re- 
presentação no espaço de fases ou espaço de 
estados. Para isso, são utilizados dois exem- 
plos de sistemas simples, que são reconside- 
rados em seções futuras. 


1.1.1 Soluções de equações 
diferenciais 


Seja à equação diferencial vetorial de primeira 
ordem 


2 = f(x), (1.1) 
sendo x € IR” o vetor de variáveis de estado, 
ou simplesmente o vetor de estado a(t) = 
O alo eat, q 4 = IRS UE TR” 
é uma função suave, chamada campo vetorial 
ou campo de velocidades, definida no subes- 
paço U. O espaço das variáveis de estado, 
que são as componentes de x, é chamado de 
espaço de fases ou espaço de estados com di- 
mensão n e ax é chamado de vetor de estado. 
Um ponto no espaço de estados representa 
um estado do sistema (1.1). Por exemplo, 
a(ti) é o estado do sistema no instante ti. 
Voltaremos a essas definições na Sec. 1.1.2. 


O sistema indicado em (1.1) representa 
um conjunto de n equações diferenciais de 
primeira ordem ou, em outras palavras, re- 
presenta o seguinte sistema dinâmico de or- 
dem n: 


A matriz jacobiana do sistema (1.1) é de- 
finida como (ver exercício 1.1) 


dx, dx, Ok 
On On O fn 


A evolução do estado do sistema ao longo 
do tempo é indicada por x(t) ou por di(x). 
Nesse caso, a(t) deve satisfazer (1.1), ou seja, 
Gia) é uma solução do sistema (1.1). Ao 


conjunto de todas as soluções de (1.1) — ini- 
ciadas de todas as condições iniciais possíveis 
em U — dá-se o nome de fluxo d : U 5 
R”, em que gi(x) = pd(x,t). O fluxo de 
um sistema dinâmico é determinado pelo seu 
campo vetorial f. Portanto, dada uma con- 
dição inicial xo, o valor da correspondente 
solução no tempo t é dado por Gi(xo), que 
também pode ser escrita como G(xo,t). O 
fluxo contém a informação sobre as possíveis 
soluções do campo vetorial. 


Dada a condição inicial go=a(t)|-p€U, 
a integração de (1.1) resulta em uma solução 
única que passa por zo. Em outras palavras, 
a solução é a função temporal q(xo,t), ou 
simplesmente G:(x0), tal que G(xo, to) = o. 


Se f(x) não depender explicitamente do 
tempo, diz-se que o sistema é autônomo, caso 
contrário o sistema é não autônomo. Além 
disso, se o campo vetorial f(x) = Ax, sendo 
A e R”*” uma matriz constante, o sistema 


é linear e invariante no tempo. Se essa ma- 
triz varia no tempo, diz-se que o campo ve- 
torial A(tja é linear e variante no tempo. 
Se, por outro lado, a matriz do sistema va- 
ria com o estado, diz-se que o campo vetorial 
f(x) = A(aeje = f(x) é não linear. Em al- 
gumas situações práticas pode não ser ime- 
diatamente claro distinguir o caso linear va- 
riante no tempo do caso não linear. Ao longo 
deste livro consideramos sistemas dinâmicos 
em tempo contínuo descritos por campos ve- 
toriais não lineares como f(x). No Capí- 
tulo 2 descrevemos sistemas dinâmicos não 
lineares em tempo discreto. 

Seja o campo vetorial f:U 5SIR?,U C 
IR”, uma constante K e y, z, soluções de 
(1.1) no intervalo [to, t1].! Se f satisfaz |f(y)— 


!Deve ser notado que uma nomenclatura co- 
mumente utilizada neste caso é representar y por 
ylt,to,yo); t E [to,t1], em que y, denota a condição 
inicial. Ao longo do texto, normalmente é preferida 


f(z)|< Kly— z|, em que |K| < o0, o campo 
vetorial é Lipschitz. A desigualdade acima 
é conhecida como a condição de Lipschitz, 
sendo K a constante de Lipschitz. Essa 
condição foi utilizada por Lipschitz para pro- 
var a unicidade de soluções de f (Monteiro, 
2006), para mais detalhes veja (Guckenhei- 
mer e Holmes, 1983; Jackson, 1989). Se o 
campo vetorial f for Lipschitz no intervalo 
to, t1], então para t E [to, ti] tem-se |y— z| < 
ly, — ZoleN tt) em que y, e zo são os valo- 
res dey e z em t = to. Esse resultado é útil 
para mostrar que, localmente (assumindo-se 
o intervalo t € [to, ti] pequeno), a evolução de 
“erros” (y — z) ocorre de forma exponencial. 
Como a constante K pode tanto ser positiva 
quanto negativa, a evolução dos erros pode 
tanto ser divergente como convergente, mas 
é localmente exponencial, se o campo veto- 
rial for Lipschitz. 


uma nomenclatura mais simples. 


(i-to), 


A desigualdade |y— z| < |yo— zo|e* 
em que y, z são soluções de (1.1), pode ser 
utilizada para constatar que a dependência 
de soluções com as condições iniciais é contí- 
nua (Alligood et al., 1994). 


Uma solução pode ser indicada como 
di(xo). O percurso dessa solução no espaço 
de fases é comumente referido como traje- 
tória. Em tal espaço não se representa o 
tempo, que corre ao longo da trajetória. A 
representação da solução ao longo do tempo 
é chamada de curva integral. Por fim, a ór- 
bita é o lugar geométrico no espaço de fases 
ocupado por uma solução. Deve ser notado 
que, segundo essas definições, uma órbita é 
mais geral que uma trajetória (Savi, 2017). 
Por exemplo, alguns sistemas têm diversas 
órbitas instáveis. Por serem instáveis não há 
trajetória que permaneça sobre a órbita. Por 
outro lado, uma trajetória pode ocupar o lu- 
gar geométrico de uma órbita, no caso da 


órbita ser estável. Contudo, conforme obser- 
vado por alguns autores, não há uma plena 
uniformidade nas definições e no uso dessa 
nomenclatura (Jackson, 1989, p. 53). 

O retrato de fases é a união de todas as 
soluções de um sistema. Portanto, o retrato 
de fases pode ser interpretado como uma re- 
presentação do fluxo, di(a), que é um mapa. 
Na prática, é comum gerar um número pe- 
queno de trajetórias e representá-las no es- 
paço de fases e chamar o diagrama resultante 
de retrato de fases. Uma representação grá- 
fica de todas as possíveis soluções resultaria 
em manchas pretas em toda a região do do- 
mínio no qual é definido o campo vetorial. O 
campo vetorial em um determinado ponto do 
espaço de fases é tangente a qualquer traje- 
tória que passa naquele ponto. 


Exemplo 1.1.1 


A equação diferencial que governa a evo- 
lução temporal de um oscilador harmô- 
nico amortecido pode ser escrita como 


E+yz+wçr=o0, (1.4) 


em que y e w, são constantes reais. 
Definindo-se y = %, a equação diferen- 
cial de segunda ordem (1.4) pode ser es- 
crita como o conjunto de duas equações 
diferenciais de primeira ordem, ou seja, 


e (1.5) 


y=—YY— wa. 


O sistema de equações (1.5) pode tam- 


bém ser escrito em forma matricial 


1 [84 Mglos 


Lx = Ag. 


Nesse caso, como f(x) = Ax, o os- 
cilador harmônico amortecido é linear. 
Portanto, a solução de (1.4) é determi- 
nada pelas raízes da equação caracterís- 
tica 


+ +=), () 


que também pode ser escrita em termos 
da matriz A como se segue 


dei AE AE PED. (1.8) 


em que 1, é a matriz identidade de di- 
mensão n e det|:| indica o determinante. 
Da álgebra linear, sabe-se que as soluções 


de (1.8) são os autovalores da matriz 4. 
Resolvendo (1.7) ou (1.8) chega-se a 


Te - (-1+ (= 408) 19) 


No caso subamortecido (4wg > 2) os 
autovalores da matriz A são complexos 
conjugados ÀA=7 + j0,em quej = v-1 
e, portanto, a solução tem a forma 


v(t) = ce"" cos(0 t+ q), (1.10) 


em que as constantes c e é podem ser 
determinadas usando as condições inici- 
ais do problema (ver Exercício 1.2). 


No exemplo do oscilador harmônico amor- 
tecido, foi fácil determinar analiticamente a 
forma geral da solução. Em geral, entretanto, 
isso não é possível na maioria dos casos como 
ilustrado no próximo exemplo. 


Exemplo 1.1.2 


A equação diferencial que governa a evo- 
lução temporal do pêndulo sem amorte- 
cimento e sem função forçante (ver Fi- 
gura 1.1) é 


mlô+mgseng=0. (111) 


A Eq. 1.11 é o resultado da aplicação 
da segunda lei de Newton ao pêndulo. 
O segundo termo na equação é o nega- 
tivo da força que movimenta o pêndulo 
em direção ao seu equilíbrio. O primeiro 
termo é a massa multiplicada pela acele- 
ração, que é a derivada segunda do des- 
locamento 1 0. 


mg 


FiGURA 1.1: O pêndulo simples. 


Mesmo sendo bastante simples, ainda 
não se conhece uma solução analítica para 
a Eq. 1.11. A solução analítica, no pre- 
sente caso, seria uma expressão para 0(t) 
que descrevesse como o ângulo do pên- 
dulo varia ao longo do tempo, dada uma 
condição inicial. Um procedimento alter- 
nativo é integrar (1.11) numericamente, 
nesse caso o resultado é uma série tem- 
poral aproximada para 0(t). 


1.1.2 Espaço de fases ou espaço 
de estados 


A solução de uma equação diferencial do tipo 
x = f(x) é uma função no tempo qi(x) ou 
a(t) E IR”. Isso é verdade tanto para os casos 
em que é possível achar uma expressão ana- 
lítica para a(t) como para os casos em que 
não há tal expressão. Em tais situações é co- 
mum encontrar-se a(t) por meios numéricos. 
Assim, mesmo não se dispondo de uma ex- 
pressão fechada para a solução, tem-se a pró- 
pria solução a(t) na forma de uma trajetória 
no espaço de fases ou uma série temporal, 
se representarmos x (normalmente um sub- 
conjunto de suas componentes) em função do 
tempo. Uma vez conhecida a evolução de 
a(t), é possível representá-la no espaço defi- 
nido pelas variáveis componentes do vetor de 
estado x. Esse espaço é normalmente cha- 
mado de espaço de estados ou espaço de fa- 


ses, cuja dimensão coincide com a dimensão 
de x. 


Seja o sistema n-dimensional x = f(a). 
O vetor de estado em um determinado ins- 
tante to é um ponto no espaço de estados 
— que também é n-dimensional — ou seja, 
a(to) E IR”. Portanto, uma solução a(t) E 
IR” pode ser representada no espaço de esta- 
dos como um ponto em movimento, ao seu 
percurso dá-se o nome de trajetória. No es- 
paço de estados ou espaço de fases a variá- 
vel independente tempo, t, corre ao longo da 
trajetória. Em outras palavras, as trajetórias 
nesse espaço são curvas parametrizadas pelo 
tempo. 


Se o sistema & = f(x) for simulado a 
partir de todas as condições inicias (no es- 
paço de fases) para as quais f for definida, 
ao conjunto de curvas obtidas dá-se o nome 
de retrato de fases. Por questões práticas é 
comum mostrar um número pequeno de tra- 


jetórias e chamar o resultado de retrato de 
fase, como feito na Figura 1.2. 


(É 
A) 
) 


o SO 


FigurA 1.2: Retratos de fase topologica- 
mente orbitalmente equivalentes. Os retra- 
tos de fases ilustrados nesta figura são TOE, 
pois é possível transformar um no outro por 
meio de deformações contínuas preservando- 
se o sentido das trajetórias. Os planos em 
que são representadas as trajetórias são es- 
paços de estado bidimensionais. 


Não é difícil aceitar que dois sistemas dis- 
tintos (ainda que de mesma ordem) apresen- 
tem retratos de fase diferentes. Uma per- 
gunta importante de ser respondida é: dados 


dois retratos de fase, em dois espaços de es- 
tado de mesma dimensão, é possível defor- 
mar continuamente um deles até chegar ao 
outro preservando a direção relativa das ór- 
bitas? Por deformação contínua entende-se 
uma deformação que pode esticar ou con- 
trair, mas não cortar nem emendar trajetó- 
rias. Se a resposta à pergunta anterior for 
positiva, diz-se que os sistemas são topolo- 
gicamente orbitalmente equivalentes, ver Fi- 
gura 1.2. A grande vantagem de estabele- 
cer (ou não) a equivalência topológica orbital 
(ETO) entre dois sistemas é que tal equiva- 
lência, se existir, implica que os sistemas têm 
comportamento dinâmico “semelhante”. 

Um termo frequentemente usado é varie- 
dade.2 Em vez de prover uma definição, apre- 
sentaremos um significado intuitivo desse termo 
deixando que os aspectos específicos apare- 
çam de forma mais contextualizada ao longo 


20 termo em inglês é manifold. 


do livro. Grosso modo, uma variedade é um 
conjunto que localmente tem a estrutura de 
um espaço euclidiano (Wiggins, 1990). Em 
termos de aplicações as variedades normal- 
mente surgem na forma de hipersuperfícies 
de dimensão m contidas no espaço IR”, m < 
n. 

Uma variedade W é invariante ao campo 
vetorial q = f(a) se, para qualquer condi- 
ção inicial pertencente a essa variedade, a 
solução também pertence à variedade, para 
todo tempo. Matematicamente, se W é in- 
variante a f, então para qualquer xo e W, 
c(t)= Axo, te W, Vte R. 


Exemplo 1.1.3 


Neste exemplo, a solução do oscila- 
dor harmônico amortecido é represen- 
tada no espaço de fases. Tomando-se 


y = 0,4, wo = lrad/s e condição inicial 
[2(0), x(0)| = (1,0), a solução (1.10) tem 
a aparência mostrada na Figura 1.3. 

Definindo-se o espaço de estados como 
o plano (x, £) E IR?, a solução mos- 
trada na Figura 1.3 pode ser represen- 
tada como uma trajetória nesse plano, 
como visto na Figura 1.4. 

Um dos grandes benefícios da repre- 
sentação de soluções no espaço de fases é 
que uma função temporal é representada 
como um objeto geométrico, e não mais 
uma função do tempo. 

No presente exemplo, a oscilação amor- 
tecida da Figura 1.3 torna-se a espiral da 
Figura 1.4. A união de todas as espirais, 
que seriam geradas pela evolução do os- 
cilador a partir de todas as condições ini- 
ciais possíveis, formam o retrato de fases, 
que é uma representação do fluxo. 


x(t) 
[> 
ho 
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FigurRA 1.3: Solução do oscilador 


harmônico amortecido. A resposta mos- 
trada deve-se unicamente à condição ini- 
cial não nula [x(0), «(0)| = (1, 0). 
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FigurA 1.4: Trajetória do oscilador 
harmônico amortecido no espaço de fa- 
ses. O ponto inicial da trajetória é 
[(0), x(0)| = (1, 0) — a condição inicial 
— e o ponto final é a origem do plano de 
fases. 


Exemplo 1.1.4 


Apesar de não termos como obter uma 
expressão fechada para O(t) na equa- 
ção (1.11), é possível escrever expressões 
matemáticas que quantifiquem a relação 
entre as grandezas envolvidas. Para isso 
definiremos uma nova variável ) = Ô e 
escreveremos a equação (1.11), que é de 
segunda ordem, como duas equações de 
primeira ordem, ou seja, 


dn = E sen = h(9,4). Ho, 


Aplicando-se a regra da cadeia e 
posteriormente multiplicando-se cruzado 


chega-se a 


do db O f(O,b) 
dy calar) “+ h0,)) 


= 9 sen x do = y x dy. (1.13) 


Integrando-se ambos os lados de (1.13) 
tem-se 


2 


= cos0 +4 = E ue: 


2 
= cos = WY+2Mc—c) 


y2 — a cos RC. CEA 
em que a constante CU é determinada pe- 
las condições iniciais da seguinte maneira: 
C = y(0)? — (29/1) cos6(0). Portanto, 
dada uma condição inicial para o pên- 
dulo, no presente caso, ela determina a 


quantidade de energia no sistema e, pelo 
fato de não haver amortecimento, essa 
quantidade de energia permanece cons- 
tante. a expressão (1.14) relaciona as va- 
riáveis de estado 0 e w). Isso significa que 
(1.14) pode ser utilizada para encontrar, 
no espaço de estados (0, 1h) E IR, as so- 
luções de (1.11) para qualquer condição 
inicial, ou seja, (1.14) pode ser utilizada 
para gerar o retrato de fases do pêndulo 
simples. 

A Figura 1.5 mostra o espaço de fases 
e trajetórias geradas a partir de algumas 
condições iniciais, fixando-se valores para 
os parâmetros m e g. Dada uma con- 
dição inicial — que determina um valor 
de € — para cada valor de 0 dentro de 
uma faixa de valores, usou-se (1.14) para 
determinar o respectivo q). Apesar de a 
Figura 1.5 não mostrar as trajetórias ini- 
ciadas em todas as condições iniciais, ela 


é, na prática, denominada retrato de fa- 
ses. 

Por fiím, menciona-se que às vezes é 
conveniente, representar o espaço de es- 
tados não sobre o plano, mas sobre o ci- 
lindro, ou seja, (0, /) E $x IR, pois 0 
e 0 + 27 coincidem. Neste exemplo, o 
espaço de estados cilindrico é localmente 
homeomórfico a IR2, ou seja, ocupa ape- 
nas a superfície do cilindro, como mos- 
trado na Figura 1.6. Outras maneiras de 
representar campos vetoriais bidimensio- 
nais são ilustradas no Exemplo 4.2.1. 


ES E A RD SE 
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FiGUurRA 1.5: Retrato de fases do pên- 
dulo simples em IR2. Cada traçado cor- 
responde à solução do sistema para uma 
determinada condição inicial. As linhas 
pontilhadas indicam a separatriz. 


E 


FigurA 1.6: Retrato de fases do pên- 
dulo simples sobre o cilindro. Repre- 
sentação da Figura 1.5 sobre o cilindro 
S x IR. Aqui as trajetórias estão sobre a 
superfície do cilindro. 


Como no caso do pêndulo simples, nem 
sempre é possível derivar analiticamente uma 
expressão para a solução de uma equação di- 
ferencial. Portanto é desejável sermos capa- 
zes de esboçar qualitativamente as soluções 
de um sistema, dada a equação diferencial 
que governa sua evolução temporal. As pró- 


ximas páginas objetivam descrever procedi- 
mentos que permitem ter uma ideia qualita- 
tiva das soluções de um sistema sem precisar 
achar expressões fechadas para tais soluções. 


1.1.3  Homeomorfismos e 
Topologia 


Na Seção 1.1.2 foi apresentado o conceito de 
equivalência topológica orbital (ETO). O ob- 
jetivo desta seção é retomar a esse conceito, 
mas agora deseja-se abordá-lo utilizando fun- 
ções. 

Seja y = h(x) E IR”, sendo h uma função 
invertível, ou seja, 3h My) =x ER”. Seh 
for contínua e invertível, e se h! também 
for contínua, h é um homeomorfismo. Além 
disso, se A for um homeomorfismo e, tanto A, 
quanto h”! forem diferenciáveis de classe C1, 
h é um difeomorfismo. 


Homeomorfismos podem preservar ou não 


a orientação do sistemas de coordenadas. As- 
sim, um homeomorfismo que preserva a dire- 
ção transforma um sistema de coordenadas 
dextrogiro — que atende o critério da mão 
direita — em outro sistema de coordenadas 
dextrogiro, como ilustrado na Figura 1.7. 


(a) (b) (c) 


Yy3 Yy2 


gn ya 


FIGURA 1.7: Sistemas de coordenadas. Os 
sistemas de coordenadas em (a) e (b) são dex- 
trogiros, pois ambos atendem à regra da mão 
direira. O sistema de coordenadas em (c) não 
é dextrogiro. O homeomorfismo que produz 
(c) a partir de (a), por exemplo, não preserva 
orientação. 


Considere agora dois conjuntos X e Y, 


existentes no espaço IR”, tais que um pode 
ser mapeado no outro por um homeomor- 
fismo, ou seja, Ih|y=h(x), hI(y)=z, 
exeX,yeyY. Se h preservar a orienta- 
ção relativa das órbitas no espaço de fases, 
diz-se que há equivalência topológica orbital 
(ETO) entre os conjuntos. 

No caso de difeomorfismos, a preservação 
da direção das órbitas é garantida se o jaco- 
biano de h for estritamente positivo em todo 
o espaço de fases, ou seja 


det|Dh(x)| > 0, Va e IR”. (1.15) 


Em (1.15) presume-se que h é diferenciá- 
vel, portanto, nesse caso h é um difeomor- 
fismo. Neste livro a ETO é de interesse e, 
por simplicidade, nos referiremos a ela sim- 
plesmente como equivalência topológica. 

De modo geral, equivalência topológica é 
suficiente para se ter equivalência dinâmica, 
mas não é necessária, no seguinte sentido. Se 


ao invés de representar uma trajetória em um 
espaço dextrogiro, por exemplo (x,y, z), o fi- 
zermos em um espaço que não o seja, por 
exemplo (x,y, —z) — nesse caso det[Dh(ax)| = 
—1 —, as duas representações não serão ETO, 
apesar de se tratar da mesma dinâmica. Por- 
tanto, excluída a mudança da ordem das co- 
ordenadas, ETO é condição necessária para 
se ter equivalência dinâmica. 


Na Eq. 1.15 está implícita a definição do 
jacobiano, que é o determinante da matriz 
jacobiana, definida em (1.3). Esses termos 
não devem ser confundidos. Portanto, sejam 
dois conjuntos definidos em um subespaço U, 
X:UCIR'eY:UcIR”, se existir um 
difeomorfismo global que preserve a orienta- 
ção relativa das órbitas, ou seja, se o jacobi- 
ano for positivo em todo o subespaço U, tais 
conjuntos são topologicamente orbitalmente 
equivalentes. 


Exemplo 1.1.5 


A fim de ilustrar a Equivalência Topoló- 
gica Orbital (ETO) (Jackson, 1989), con- 
sidere a Figura 1.8. 
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FIGURA 1.8: Retratos de fase hipotéti- 
cos. Os casos (a) e (b) são topologica- 
mente orbitalmente equivalentes entre si, 
mas não são equivalentes nem a (c) nem 


a (d) (Jackson, 1989). 


Note que é possível deformar o re- 
trato de fases em (a) de modo a se trans- 
formar no retrato de fases mostrado em 


3, 


(b). De fato, esses retratos de fase estão 
relacionados pelo seguinte homeomorfismo: 


y = 11 
E vo e Vo 0 
yo =-—12, Vx3<0 
e 
ty =W 


fps To=+Vya, Yyo20 
vo =—V—y2, Vya <0. 


Como h e h! não são diferenciáveis 
na origem, A não é um difeomorfismo glo- 
bal (ver Exercício 1.3) e o critério, ex- 
presso por (1.15), para se ter ETO não 
se aplica neste caso. 

Por outro lado, os retratos de fases 
em (a) e (b) são claramente distintos da- 
quele mostrado em (c). Portanto este 
não é topologicamente orbitalmente equi- 
valente a nenhum daqueles. 


Um caso menos evidente é ilustrado 
pelo retrato de fases em (d). Devido à 
orientação das órbitas, nem o retrato de 
fases em (a), nem o retrato de fases em 
(b), podem ser deformados de maneira a 
coincidirem com aquele mostrado em (d). 
Considere-se o seguinte mapa 


4 Ly Vy + O 
els x9 = 1/yo Vyo O 
= sey=-0,:=1,2. 


Nesse caso, como h não é contínua na 
origem — note que h não se define na ori- 
gem —, segue-se que não se trata de um 
homeomorfismo e, portanto, as órbitas 
não podem ser continuamente mapeadas 
do retrato de fases em (d) para o retrato 
de fases em (a). Consequentemente, es- 
ses retratos de fase não são ETO. 


Exemplo 1.1.6 


Neste exemplo deseja-se ilustrar sistemas 
que não são TOE (Monteiro, 2006, p. 201). 
Considere os sistemas 


tj = —%9 E Yi = Yo 

to = T1 Do = Ui; 
sendo que ambos têm autovalores À = 
+). As soluções desses sistemas no es- 


paço de fases encontram-se sobre órbitas 
fechadas. Por exemplo, para o primeiro 


sistema uma solução é m(t) = cost e 
ga(t) = sent. Para o segundo sistema 
tem-se yw(t) = — cost e y>(t) = sent. 


Um homeomorfismo (que também é um 
difeomorfismo) que conecta os dois re- 
tratos de fases é dado por (ver Exercí- 


cio 1.4): 


h: À y = —Z1 
Ya = To. 
O jacobiano de h é dado por 


derfDi(o)]=det q a | = ANO) 


0 IL, 
e, portanto, as soluções desses sistemas 
não são ETO, pois o movimento das so- 
luções de cada sistema é oposto um ao 
outro, apesar dessas soluções serem “cír- 
culos” em cada caso. Note que neste caso 


h não preserva a orientação (ver Exercí- 
cio 1.5). 


1.2 Pontos Fixos e 
Estabilidade 


Na presente seção são definidos os pontos fi- 
xos, ou pontos de equilíbrio de sistemas di- 
nâmicos contínuos. Outro ponto importante 
a ser abordado na presente seção é o da es- 
tabilidade (local) de pontos fixos. 


1.2.1 Localização de 
pontos fixos 
Por definição, os pontos fixos de um sistema 


dinâmico contínuo x = f(x) são as soluções 
da equação 


f(x) =0, (1.17) 
pois isso implica à = 0, indicando que nesses 


pontos o campo vetorial é nulo e, portanto, 
se o sistema chegar a esse ponto, ali ficará 


imóvel, na ausência de distúrbios. Isso jus- 
tifica a nomenclatura pontos fixos ou pontos 
de equilíbrio. 


Exemplo 1.2.1 


Os pontos fixos do oscilador harmônico 
amortecido (1.4) são (ver equação (1.5)) 


EE (1.18) 


Para y = 0, a segunda equação 
em (1.18) fornece x = 0. Portanto, o os- 
cilador harmônico amortecido tem ape- 
nas um ponto fixo, que é (x, y) = (0, 0), 
a origem do espaço de fases. 


Apesar de derivado para o oscilador 
harmônico simples, o resultado do Exem- 
plo 1.2.1 é geral no seguinte aspecto: todo 


sistema dinâmico linear e autônomo tem 
apenas um ponto fixo e esse ponto fixo é a 
origem do espaço de fases. 


Exemplo 1.2.2 


Os pontos fixos do pêndulo simples (1.11) 
são, por definição, dados pela solução 
do seguinte sistema de equações (ver Fi- 
gura 1.9): 


09=0=4= f(9,4) 
y=0= —E sen = o) 


pontos fixos — 0... 
(em, 0), (37,0), ... 


0 
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FIGURA 1.9: Pontos fixos do pêndulo 
simples. Nos pontos fixos a velocidade 
angular do pêndulo é nula. 


Os valores de (0,1) que satisfa- 
zem (1.19) são ) = 0, conforme visto na 
primeira equação e 0 = sen !(0). Nota- 
se que O = 0, +7, +27,... satisfazem a 
segunda equação de (1.19), logo os pon- 
tos fixos são 


(9,1) = (0,0), (7,0), (+27,0),... (1.20) 


como ilustrado na Figura 1.9. Há infi- 
nitos pontos fixos (um para cada revo- 
lução) na posição superior e na posição 
inferior, mas como são coincidentes é co- 
mum dizer que o pêndulo tem dois pon- 
tos fixos. Como visto adiante, o ponto 
fixo superior é instável (indicado por um 
círculo claro). 


Assim como aconteceu para o pêndulo sim- 
ples, é comum sistemas não lineares terem 
mais que um ponto fixo e existem sistemas 
que nem pontos fixos têm (ver Exercício 1.6). 
Quando um sistema tem mais de um ponto 
fixo, alguns podem ser estáveis e outros ins- 
táveis, como visto na próxima seção. 


1.2.2 Estabilidade de 
pontos fixos 


A estabilidade de pontos fixos pode ser deter- 
minada observando-se a evolução do sistema 
na vizinhança do ponto fixo. Considere a Fi- 
gura 1.10a na qual é mostrado o ponto fixo 
x = (x,y). A vizinhança desse ponto fixo, 
U cIR?, na figura é mostrada como um cír- 
culo de raio O < d < 1 (ô pequeno). Seja 
xo = (xo, yo) € U a condição inicial do sis- 
tema no instante to, ou seja, || xo — % ||< 6. 


Se 
lim Iz(t)—-x|>0,t> to (1.21) 
—00 


diz-se que o ponto fixo Z é assintoticamente 
estável e, portanto é chamado de sorvedouro. 
Em (1.21) a(t) é a evolução do sistema a 
partir da condição inicial xo. Portanto, um 
ponto fixo % é assintoticamente estável se 
Sô > 0 tal que, para uma condição inicial 
xo — % ||< 6, a expressão (1.21) é válida. 


Considere novamente o ponto fixo % = 
(x, y)e0O<e<ó<X1 as constantes mos- 
trados na Figura 1.10b. As vizinhanças do 
ponto fixo £, Us, U. C IR?, são definidas 
como 


Us =(xeR? | |x-zl||<o 
e (1.22) 
VU. -(xeRº || x-z |< e. 


Dada uma condição inicial xy E U., en- 
tão se Jó > 0 tal que a(t) E Us, Vt > to, 
diz-se que o ponto fixo x é um centro e é 
estável. A esse tipo de estabilidade também 
se dá o nome de estabilidade neutra ou es- 
tabilidade de Liapunov. Pela Figura 1.10b 
percebe-se que a evolução de a(t), a partir 
de xo e Vt > to pode não ficar confinada a 
U., mas necessariamente deverá ficar conf- 
nada a Us. 


(c) 


E 7) 


IN 3o/ 


FIGURA 1.10: Representação gráfica da es- 
tabilidade de pontos fixos. O ponto fixo 
(x,y) é assintoticamente estável em (a), nesse 
caso diz-se que é um sorvedouro. O ponto 
fixo é estável (estabilidade neutra ou de Li- 
apunov) em (b) e nesse caso é chamado de 
um centro. Em (c) o ponto fixo é instável e 
é denominado de um repulsor ou fonte. 


Por fim, diz-se que um ponto fixo % é um 
repulsor ou uma fonte quando for instável 
(ver Figura 1.10c). Um ponto fixo é instá- 
vel quando, dada uma condição inicial em to, 
| xo — E ||< 6, 


lim [x(t)-2[>o0,t>to, (1.23) 
—s00 


em que x(t) é a evolução do sistema a partir 
da condição inicial xo. Na prática, basta que 
a solução se afaste “o suficiente” do ponto 
fixo, para que este seja considerado instável. 


Em todas as definições de estabilidade 
abordadas nesta seção, assumiu-se que a con- 
dição incial encontrava-se na vizinhança do 
ponto fixo. Portanto, esse tipo de esta- 
bilidade é apenas local. Como visto mais 
adiante, é possível (de fato, é comum) que 
um sistema dinâmico não linear tenha pon- 
tos fixos instáveis, mas que o sistema seja 
globalmente estável. 


Tendo compreendido os tipos de estabi- 
lidade local (assintótica, neutra e instabili- 
dade), é importante saber determinar a es- 
tabilidade de um ponto fixo % E IR” de um 
dado campo vetorial f(x). Para esse fim, 
entretanto, é necessário um teorema, que é 
enunciado na Seção 1.3.2 e, portanto, adia- 
remos parte da discussão até aquela seção. 


Quanto à estabilidade, os pontos fixos po- 
dem ser sorvedouros, centros ou repulsores 
(fontes). Uma outra categoria de pontos fi- 
xos é constituída de pontos de sela. Tais pon- 
tos fixos também são instáveis, mas diferem 
dos repulsores em que aos pontos de sela está 
associada pelo menos uma variedade estável. 
Exemplos de pontos de sela aparecem na Fi- 
gura 1.13 em que em (0, — 7) e (0,7) podem 
ser vistas direções estáveis e instáveis. 


A classificação acima mencionada indica 
o tipo de estabilidade dos pontos fixos. Uma 
classificação complementar de pontos fixos 
(hiperbólicos) procura revelar o tipo de com- 
portamento do fluxo na vizinhança do ponto 
fixo. Se o fluxo não for “oscilatório” e to- 
das as direções são estáveis ou instáveis em 
torno de um ponto fixo, esse ponto fixo será 
um nó. Se o fluxo for oscilatório, o ponto fixo 
é um foco. Alguns exemplos estão ilustrados 
na Figura 1.11. 


(a) (b) (e) (d) 


— O) 


FiGURA 1.11: Exemplos de tipos de pontos 
fixos. (a) nó instável (repulsor), (b) nó está- 
vel (sorvedouro), (c) ponto de sela, e (d) foco 
estável. 


Como visto mais adiante neste capítulo, 
os autovalores da matriz jacobiana avaliada 
no ponto fixo são especialmente úteis na clas- 
sificação de pontos fixos no caso em que a 
parte real de todos os autovalores for dife- 
rentes de zero — ou seja, quando o ponto fixo 
for hiperbólico. 

Antes de encerrar esta seção observa-se 
que o conceito de estabilidade estrutural, a 
ser visto no Capítulo 3, é fundamentalmente 
distinto do conceito de estabilidade visto nesta 
seção. Em poucas palavras, ao se investigar 


a estabilidade de Liapunov ou assintótica de 
um ponto fixo, deseja-se conhecer a evolução 
de soluções obtidas “perturbando-se” condi- 
ções iniciais. No caso da estabilidade estru- 
tural, deseja-se estudar a evolução de solu- 
ções obtidas perturbando-se o campo veto- 
rial. 

Seguindo um procedimento semelhante ao 
descrito no Exemplo 1.1.6 é possível mostrar 
que focos e nós são topologicamente orbital- 
mente equivalentes (Monteiro, 2006, p. 200). 


1.3 Linearização de 
Sistemas Não Lineares 


Na seção anterior estudou-se a classificação 
da estabilidade local de pontos fixos. Na pre- 
sente seção é revisto como é possível linearizar- 
se um sistema dinâmico não linear em torno 
de um ponto. Mais do que isso, são apre- 


sentados o teorema de Hartman-Grobman e 
o teorema das variedades hiperbólicas ou te- 
orema da variedade estável. Tais teoremas 
permitem relacionar a análise de estabilidade 
de pontos fixos hiperbólicos de um sistema 
linearizado à análise de estabilidade local do 
sistema original não linear. Quando o ponto 
fixo for não hiperbólico uma forma de de- 
terminar sua estabilidade é utilizar conceitos 
derivados da teoria de estabilidade de Lia- 
punov. Alguns desses conceitos também são 
apresentados ao fim desta seção. 


1.3.1 Linearização 


Seja o sistema não linear 


À y=g(x,y), (oo) 


em que (x,%)) é um ponto fixo, ou seja f(x,y) = 
g(x,y) = 0. A expansão em série de Taylor 


em torno de (x,y) é: 


e So É (2—2)+ 
0% Ie, g)=(2,9) 
E al (y— 9) +0º, 
Ya,y=(2,9) 
La ta DO E 
y = g( , ) DE Ea =] Tr 
+ a (y — 9) + O?, (1.25) 
Ve, y)=(2,9) 


em que O? indica os termos de ordem quadrá- 
tica e superior. Fazendo a seguinte mudança 
de variáveis X = 2x-—-Zey=y-—%y tem-se 
que & = ey =, uma vez que o ponto fixo 
(x,y) é constante. Usando-se essa transfor- 
mação de variáveis em (1.25) e expressando- 


se o resultado em forma matricial tem-se 


of of 
, dx Oy = 
5 +[5| +02.(1.26) 
dx Oyl e m=(2,9) 


O primeiro termo à direita da equação 
(1.26) é a parte linear do sistema original. 
A matriz da equação (1.26) é a matriz ja- 
cobiana avaliada no ponto fixo (7,y). Por- 
tanto, analizar a estabilidade de pontos fi- 
xos usando-se tal matriz corresponde a ana- 
lizar à estabilidade do sistema original na vi- 
zinhança U € IR? do ponto fixo (7,1), pois 
nessa vizinhança a parcela O? pode normal- 
mente ser desprezada. Se a matriz jacobiana 
avaliada no ponto fixo tiver ao menos um au- 
tovalor com parte real nula, ele é dito não 
hiperbólico e nesse caso O? não pode ser des- 
prezado na análise da estabilidade. 


Será que a determinação de estabilidade 
de um ponto fixo usando-se a matriz jacobi- 
ana é equivalente à análise local do sistema 
original? Os próximos dois teoremas, enun- 
ciados sem apresentar as provas, respondem 
a essa pergunta para o caso de pontos fixos 
hiperbólicos. 


1.3.2 O teorema de 
Hartman-Grobman 


Teorema 1.3.1 (Hartman-Grobman). Seja 
o sistema dinâmico x = f(x), a E IR”, com 
ponto fixo em LX. Seja a linearização desse 
sistema em torno de x 


x = Df(a)ã, (1.27) 
sendo & = (a — 4) E IR” suficientemente pe- 


queno e Df(x), a matriz jacobiana avaliada 
no ponto fixo Z. 


Se Df(x) não tiver nenhum autovalor com 
parte real nula, existe um homeomorfismo h 
em uma vizinhança U de x em IR” que local- 
mente mapeia as soluções de x = f(a) nas 


soluções de (1.27) preservando a direção das 
órbitas. 


O resultado do Teorema 1.3.1 está ilus- 
trado de forma simplificada na Figura 1.12. 


Ez 
ES 


t=f(0) Z=Df() 


FiGUuRrA 1.12: Representação gráfica do Te- 
orema de Hartman-Grobman. 


Uma das consequências do teorema de 
Hartman-Grobman é que, para o caso em 


que Df(x) não tiver autovalor com parte real 
nula, a estabilidade do ponto fixo x é de- 
terminada pela parte real dos autovalores da 
matriz jacobiana avaliada no ponto fixo, ou 
seja, Df(x). Portanto, basta calcular os au- 
tovalores À;, à = 1,...,n da matriz jacobiana 
de f(x) avaliada no referido ponto fixo. Em 
outras palavras, deve-se determinar os n va- 
lores de À que são as soluções de 


det [Df(x) — AL] = 0, (1.28) 


sendo Df(x) a matriz jacobiana, conforme 
definida em (1.3). 

Se todos esses valores forem tais que 
RelA;] < 0,i=1,...,n, então o ponto fixo % 
é assintoticamente estável. Por outro lado, se 
3 À; | RelA;| = 0, o ponto fixo é não hiperbó- 
lico e o Teorema 1.3.1 não se aplica. Outras 
denominações para um ponto fixo não hiper- 
bólico são: elíptico e degenerado. Por fim, se 
3 A; | RelA;] > 0, o ponto fixo é instável. 


Para sistemas lineares a matriz jacobiana 
é constante em todo o espaço de estado, isso 
é, Df(x) = A (Exercício 1.1). Portanto, a 
estabilidade de um sistema linear é determi- 
nada exclusivamente pela parte real de seus 
autovalores, como é sabido da teoria de siste- 
mas lineares. A seguir é discutido um exem- 
plo que usa um sistema não linear, o pêndulo 
simples. 


Exemplo 1.3.1 


Como visto no exemplo 1.2.2, os pon- 
tos fixos do pêndulo simples são dados 
pela expressão (1.20). A Figura 1.9 mos- 
tra que o pêndulo tem apenas dois pon- 
tos fixos distintos, a saber 2, = (0,0) e 
go = (7,0). Deseja-se determinar a esta- 
bilidade dos mesmos. 

A matrix jacobiana do pêndulo sim- 


ples (ver Eg. 1.12) é dada por 


Gn an 

o à qui 
Dj(2)=| op E | Pes 129) 

00 Oy 


Avaliando-se a matriz jacobiana em 
x, = (0,0), tem-se 


1 
Djte)= | 4 po) 


que tem autovalores À = +7,/9/º. Se- 
melhantemente, avaliando-se Df(x) em 
£o = (7,0), tem-se 


0 1 
l 


que tem autovalores À = +,/9/º, ver 
Exercício 1.7. 

Portanto, como os autovalores de 
Df(x1) têm parte real nula, trata-se de 
um centro, ou seja, é um ponto fixo de es- 
tabilidade neutra, como mostrado na Fi- 
gura 1.13. Essa conclusão é coerente com 
o conhecimento físico que se tem do pên- 
dulo simples sem amortecimento, pois 
permanece oscilando em torno da posição 
inferior, que corresponde ao ponto fixo. 
Apesar de coerente, este caso deve ser 
considerado com cuidado, pois o ponto 
fixo em questão é não hiperbólico e o Te- 
orema 1.3.1 não se aplica. No Exem- 
plo 1.3.3 analisaremos este caso utili- 
zando a teoria de Liapunov. 


FIGURA 1.13: Estabilidade de pontos fi- 
xos do pêndulo simples. O ponto fixo em 
(0,0) é um centro, enquanto que os pon- 
tos fixos em (—7,0) e (7,0) são pontos 
de sela. 


Por outro lado, Df(%x,) tem um au- 
tovalor positivo e outro negativo. Con- 
sequentemente, Zo é instável, como era 
esperado. Note que a presença de um 
autovalor negativo e outro positivo em 
Df(x,») é indicado na Figura 1.13, por 
uma direção estável e outra instável. 


1.3.3 O teorema das variedades 
hiperbólicas 


Teorema 1.3.2 (Das variedades hiperbóli- 
cas). Seja & = f(x), x E IR” um sistema 
dinâmico com ponto fixo em %. Se a matriz 
jacobiana avaliada no ponto fixo x , Df(ã) 
tiver ns autovalores estáveis, ny autovalores 
instáveis (n = ns + nu) então existem varie- 
dades estáveis e instáveis, W* eWº", que no 
ponto fixo X tangenciam as variedades defi- 
nidas pela matriz jacobiana, ES e E“ — os 
autoespaços. O subespaço ES é gerado pe- 
los autovetores correspondentes aos autovalo- 
res estáveis e o subespaço E” é gerado pelos 
autovetores correspondentes aos autovalores 
instáveis. Além disso, tem-se que dim(ES| = 
dim(Wº | =n, e dim(E"t=dim(W" |=ny. Se 
f for de classe C”, ou seja, se f for diferen- 
ciável r vezes, as variedades Wº* e W" tam- 
bém são de classe C”. 


O resultado do Teorema 1.3.2 está ilus- 
trado de forma simplificada na Figura 1.14. 
O teorema das variedades hiperbólicas tanto 
aborda variedades estáveis quanto instáveis, 
por essa razão usamos a nomenclatura advo- 
gada por Monteiro (2006). Alguns autores 
referem-se ao Teorema 1.3.2 como o teorema 
da variedade estável. 


a 


X=f(0) Z=Df) 


FIGURA 1.14: Representação gráfica do teo- 
rema da variedade hiperbólica. 


Como pode ser observado na Figura 1.14, 
existe um homeomorfismo entre os retratos 


de fases do sistema não linear e linear que lo- 
calmente preserva as direção das órbitas. Foi 
visto anteriormente que esses dois sistemas 
são topologicamente orbitalmente equivalen- 
tes. Como as dimensões das variedades não 
são afetadas pelo homeomorfismo, ou seja, 
dim(Eº|= dim(Wº1 e dim(E"|-dim(W'a, 
tais dimensões são exemplos de invariantes 
topológicos. 


No caso de pontos fixos hiperbólicos, o 
teorema de Harman-Grobman e o teorema 
das variedades hiperbólicas garantem que o 
sistema dinâmico não linear e o sistema line- 
arizado são localmente topologicamente or- 
bitalmente equivalentes. No caso de pontos 
fixos não hiperbólicos, o teorema de Harman- 
Grobman não se aplica. Nesse caso, para de- 
terminar a estabilidade de tal ponto fixo não 
basta analisar o sistema linearizado em torno 
desse ponto, mas é necessário considerar ter- 
mos de mais alta ordem. A teoria da varie- 


dade central é a ferramenta adequada para 
descrever o comportamento de um sistema 
não linear em torno de um ponto fixo não 
hiperbólico (Monteiro, 2006). 


Exemplo 1.3.2 


Seja o sistema dinâmico & = f(x), x € 
IR”. Deseja-se estabilizar o sistema em 
torno do valor de referência & E IR” por 
meio da lei de controle u = —K(x — 
&£), K E IR”*”. Qual é a condição para 
estabilidade assintótica em torno de £&? 
Pelo fato de se desejar a estabilidade 
em torno de uma referência, o problema 
em questão trata de estabilidade local. 
Portanto, são utilizados os conceitos das 
seções 1.2 e 1.3 para resolver o problema. 
Em primeiro lugar, o sistema contro- 
lado & = f(x) — K(a — %) é linearizado 
em torno da referência £. Assim, fazendo 


uso de (1.25) tem-se 


Lt = Hale-r—K(a-— lp + 
= A 
OK (a — &) : 
dE 2. sapo 
= H%)-0+D/(&)(a — &) — 
ipa cn GE 
z-t = [Df(g)-Kl(x-2)+02.(1.32) 


Fazendo-se a mudança de variáveis e = 
z—x, a equação (1.32) pode ser reescrita 
da seguinte forma 


= [Df(&) - K]e + O?(e) 
ID f(&) — Kje, (1.33) 


em que os termos de mais alta ordem fo- 
ram desprezados. A condição para que, 


localmente, o sistema controlado convirja 
assintoticamente para % equivale à con- 
dição de que a origem do sistema (1.33) 
seja assintoticamente estável, ou seja é 
necessário que a parte real de todos os 
autovalores de [Df(x) — K] seja negativa 
(ver Exercício 1.11). 


1.3.4 Estabilidade de Liapunov 


A estabilidade de um ponto fixo não hiperbó- 
lico não pode ser determinada observando-se 
a parte real dos autovalores da matriz jaco- 
biana avaliada no ponto fixo. Um dos proce- 
dimentos viáveis para determinar a estabili- 
dade de um tal ponto fixo é o método direto 
de Liapunov. 

Para facilitar a discussão, consideremos 
o caso bidimensional mostrado na Eq. 1.24. 
Usando a discussão da Sec. 1.2.2, dizemos que 


o ponto fixo (x, y) é estável se uma trajetória, 
que em um determinado instante está sufici- 
entemente próxima desse ponto fixo, perma- 
nece próxima por um tempo indefinido. 


Seja V(x,1y) uma função escalar em IR?, 
ou seja, V: IR? > IR e que seja diferenciável 
ao menos uma vez. Além disso, V(x,y) = 0 
e que o lugar geométrico de V(x,y) = C, em 
que € é uma constante positiva, é um ca- 
minho fechado que inclua (x, y) e que, para 
cada valor de €, o respectivo caminho fe- 
chado seja diferente. A função V é chamada 
de função de Liapunov. Essas definições es- 
tão ilustradas na Figura 1.15a. 


(a) 


FIGURA 1.15: Ilustração do método direto 
de Liapunov. Seja (x,y) o ponto fixo sob es- 
tudo. Em (a) são mostradas três curvas de 
nível da função V. Essa curvas não são traje- 
tórias do sistema. Em (b), mostra-se apenas 
uma curva de nível. O vetor gradiente VV 
é sempre normal à respectiva curva de nível 
em cada ponto. O campo vetorial nos mes- 
mos pontos são indicados pelas outras setas. 
A condição para a estabilidade do ponto fixo 
(x,y) é que o campo vetorial — indicado pelas 
setas interiores à curva fechada nesta figura 
— ao longo de V = € aponte para dentro da 
curva de nível, em outras palavras, o ângulo 
entre o campo vetorial e VV deve ser obtuso. 


O operador gradiente para o caso bidi- 
mensional é definido como 


v=[& o (1.34) 


O vetor gradiente, VV, é normal à curva 
V(x,y) = €C. O produto interno de dois 
vetores é nulo se tais vetores forem ortogo- 
nais, é positivo se o ângulo entre os vetores 
for agudo e é negativo se o ângulo for obtuso. 

Consideremos os vetores campo vetorial 
feVV. Observando a Figura 1.15b, em que 
as setas que apontam para o interior da curva 
fechada V = € são os valores do campo ve- 
torial em cada um desses pontos, percebe-se 
que uma consequência dessas setas aponta- 
rem para dentro é que os ângulos entre VV e 
f na Figura 1.15b são todos obtusos, ou seja, 
VV.f <0, em que o ponto indica o produto 
interno. Se todos os ângulos são obtusos, o 
campo vetorial ao longo de V = € aponta 


para dentro, o que garante a estabilidade do 
ponto fixo. 

Uma interpretação interessante pode ser 
feita, lembrando-se que x = f, portanto a 
condição de estabilidade VV.f < O pode ser 
reescrita como VV. x < 0. Aplicando a regra 
da cadeia, a derivada temporal de V(x, y) é 
dada por 


oV oV 
V = —tI+>— 
(x, 9) dE + ag? 
= VV.&, (1.35) 
em que a = [x y|”. Portanto, a condição 


de estabilidade pode ser escrita simplesmente 
como V < 0. É comum interpretar a função 
de Liapunov V como sendo uma função de 
energia. A condição de estabilidade V < 0 
corresponde a um sistema que dissipa ener- 
gia e, portanto, sua energia diminui com o 
tempo, o que é coerente com o conceito de 
estabilidade segundo Liapunov. Esse resul- 
tado é resumido no seguinte teorema. 


Teorema 1.3.3 (Estabilidade de Liapunov). 
Seja x = f(x), x € IR”, o campo vetorial 
com ponto fixo X. Seja a função escalar V, 
definida em uma vizinhança U de %, diferen- 
crável ao menos uma vez, ou seja, V:U => 
Ré SesViz)=0eV(t) > Ogpara 
vaz, eii)V(x) <0 dentro deU — fx), 
então o ponto fixo X é estável. Além disso, 
se iii) V(a) < O dentro de U — (x), então o 
ponto fixo X é assintoticamente estável. 


Se a vizinhança U for todo o espaço IR”, 
o ponto fixo é dito globalmente assintotica- 
mente estável quando as condições i) e iii) fo- 
rem verdadeiras (Wiggins, 1990, p. 12). Deve 
ser notado que os resultados de Liapunov 
são úteis para declarar um ponto fixo está- 
vel, mesmo no caso não hiperbólico, se uma 
função de Liapunov V for encontrada. Se V 
não for encontrada, não é possível declarar o 
ponto fixo instável, pois é impossível testar 
todas as funções de Liapunov candidatas. 


Exemplo 1.3.3 


Foi visto no Exemplo 1.2.2 que o pêndulo 
simples tem (matematicamente) infinitos 
pontos fixos. Fisicamente, tais pontos fi- 
xos correspondem a duas posições: a ver- 
tical superior (0,4) = (+k7,0), para va- 
lores inteiros e ímpares de k; e a vertical 
inferior, para k igual a zero e valores in- 
teiros pares. 

No Exemplo 1.3.1 foi estudada a es- 
tabilidade dos pontos fixos do pêndulo 
simples não amortecido. O ponto fixo 
superior é hiperbólico e, portanto, pode 
ser analisado em termos de estabilidade 
observando os autovalores da matriz ja- 
cobiana. Contudo, o ponto inferior é não 
hiperbólico e sua estabilidade não pode 
ser analisada com segurança pelo mesmo 
método. Felizmente, o Teorema 1.3.3 não 
requer que o ponto fixo seja hiperbólico 


e, portanto, o usaremos para analisar a 
estabilidade de (0,1) = (0,0). 
Começamos buscando uma função de 
Liapunov que seja igual à energia total 
do pêndulo simples. A energia cinética é 
dada por 1142 e a potencial por: g/(1 — 
cos0). Portanto, uma função de Liapu- 
nov candidata é (Bretas et al., 2007): 


VB — 00) + gº(1 — cos 6). 


É imediato perceber que V(0,0) = O 
eque V(9,/)) £L0seb £0e 0  +kr, 
para k = 0,2,4,..., portanto V(0,%)) sa- 
tisfaz a condição i) do Teorema 1.3.3. A 


derivada da função de Liapunov é 


962... : 

E + 90 sen 6 

= bt) + gt senB 

= (gt sen 0-+82) = (0), 


V(9,4) 


uma vez que para o pêndulo tem-se que 
ô=yew=-g/t send. Portanto, o 
ponto fixo inferior é estável no sentido 
de Liapunov, ou seja, sua estabilidade é 
neutra. 


Uma outra alternativa para a análise de 
sistemas com pontos fixos não hiperbólicos é 
o Teorema da Variedade Central (Monteiro, 
2006, p. 212) e (Fiedler-Ferrara e Prado, 1994, 
p. 363). Esse assunto é por si só um grande 
tema na análise de sistemas dinâmicos não 
lineares, mas não é aqui abordado por não 
ser necessário ao longo da leitura deste livro. 


1.4 Comportamento 
Assintótico 


A Figura 1.4 mostra a trajetória do oscilador 
harmônico amortecido a partir da condição 
inicial a(0). A trajetória descrita pelo sis- 
tema é uma espiral, que é característica do 
comportamento transitório ou transiente do 
oscilador. Em contraposição a esse compor- 
tamento, tem-se o comportamento em estado 
estacionário ou assintótico, que é típico de 
sistemas dissipativos. No caso do oscilador 
harmônico, o comportamento assintótico é 
caracterizado pelo repouso (ver Fig. 1.3) que 
corresponde à origem do plano de fases da 
Figura 1.4. Com relação ao comportamento 
assintótico, a seguinte definição é comumente 
usada. 


Diz-se que x, € IR” é um ponto limite w 
de um ponto qualquer x € IR” se existe uma 
sequência (t;,t; — oo tal que d(x, t;) > E. 
Se a sequência for (t;,t; — —oo fala-se em 
termos de um ponto limite a. O conjunto 
de todos os pontos limite w de um fluxo é 
chamado de conjunto limite w e é indicado 
como w(ax). Esses conceitos estão ilustrados 
na Figura 1.16. O conjunto limite a, indi- 
cado como a(a), é definido de maneira aná- 
loga. 


FIGURA 1.16: Pontos e conjuntos limite w. 
Em (a), o ponto x, é um ponto limite w de 
x. O mesmo é verdadeiro sobre o plano em 
(b). Além disso, em (b), o conjunto de todos 
os pontos limite w de x é o ciclo fechado 7. 
Portanto y é o conjunto limite w de x e do 


fluxo d(x, t). 


Na Figura 1.16b, a sequência de pontos 
indicados estão sobre uma seção que é trans- 
versal ao fluxo. O objetivo é ilustrar que o 
ponto x, é o ponto de cruzamento entre o 
ciclo y e a referida seção. A relação entre 
fluxos e suas interseções com sessões especí- 


ficas é tratada com detalhes no Capítulo 4. 


Exemplo 1.4.1 


Seja % um ponto de sela pelo qual pas- 
sam variedades estável W*(x) e instável 
W'(ax). Seja um ponto x tomado sobre 
a variedade estável, ou seja, x € W'(x), 
o conjunto limite w de x é o ponto fixo, 
portanto x = w(x). Analogamente, o 
mesmo ponto fixo é o conjunto limite a 
de qualquer ponto sobre a variedade ins- 
tável, ou seja, Z = a(x) sex € W"(%) 
(Savi, 2017, p. 145). 


Diz-se que xo € IR” é um ponto não er- 
rante (non wandering) se para qualquer vi- 
zinhança U dex,eT>0,dltl>7T tal que 
AU, NU £Q. O conjunto não errante de 
um fluxo é o conjunto de todos seus pontos 
não errantes. Pontos fixos, independente de 


sua estabilidade, são pontos não errantes. O 
mesmo é verdade com relação a órbitas pe- 
riódicas. 

Um conjunto A é invariante sob ação do 
campo vetorial x = f(a) se para qualquer 
zo €E 4, xo, t) E 4, Vt. Em palavras, se 
A for invariante sob a ação de f e tomarmos 
um ponto ou uma trajetória em 4, o sistema 
permanece em 4 indefinidamente. 


Um conjunto invariante 4 C IR” é atra- 
tivo — um atrator — se existe uma vizinhança 
UdeAtal queVrxeVeWt>0, da, t)EU 
e d(x, t) > A à medida que t > oo. Em 
palavras, o conjunto A atrai todas as traje- 
tórias iniciadas em U. A união de todas as 
condições iniciais que resultam em trajetó- 
rias atraídas para 4 é chamada de bacia de 
atração de A e é representada matematica- 
mente por: 


Jau), t<o. 


Um conjunto invariante 4 é topologica- 
mente transitivo se, para quaisquer dois con- 
juntos abertos U,V € A dt tal que G(U, )N 
V 20. Em palavras, dado um ponto em 
A, em algum momento no futuro, a tra- 
jetória iniciada nesse ponto retornará arbi- 
trariamente perto desse ponto. Um atrator 
é um conjunto topologicamente transitivo, 
logo atratores não podem ser formados por 
duas partes desconexas. A Seção 4.3 trata 
desse tópico. 


Leitura Recomendada 


Textos, sobre alguns aspectos de dinâmica 
não linear, para o público geral são (Gleick, 
1993; Stewart, 1997) sendo que Gleick é um 
escritor e historiador especializado em assun- 
tos técnicos, ao passo que Stewart é um ma- 
temático. Esses livros foram traduzidos para 
o português (Gleick, 2006; Stewart, 1991). 


Uma introdução a sistemas dinâmicos 
não lineares em portugês pode ser encontrada 
nos seguintes livros (Fiedler-Ferrara e Prado, 
1994; Monteiro, 2006; Savi, 2017). Uma inte- 
ressante abordagem ao tema foi apresentada 
pelo Prof. Christophe Letellier em francês 
(Letellier, 2006a) e depois traduzida ao in- 
glês (Letellier, 2019). 


Uma abordagem mais detalhada sobre o 
assunto pode ser encontrada em (Thompson 
e Stewart, 1986; Jackson, 1989; Alligood et al. 
1994; Sprott, 2003; Monteiro, 2006), sendo 
que uma apresentação matemática mais for- 
mal é seguida em (Guckenheimer e Holmes, 
1983; Wiggins, 1990). 

Aspectos específicos de topologia podem 
ser encontrado nos livros (Gilmore e Lefranc, 
2002; Gilmore e Letellier, 2007; Letellier e 
Gilmore, 2013). 


A abordagem de sistemas dinâmicos não 
lineares com um viés para controle não linear 


pode ser encontrado em (Slotine e Li, 1991). 

O sistema de Lorenz é apresentado e ana- 
lisado em (Fiedler-Ferrara e Prado, 1994; 
Monteiro, 2006). 


Exercícios 


1.1. Mostre que a matriz jacobiana de um 
sistema linear é constante. 


1.2. Discuta como o parâmetro r no Exem- 
plo 1.1.1 afeta a convergência da solução do 
oscilador harmônico. 


1.3. Discuta o problema de tentar definir 
uma única matriz jacobiana para h no Exem- 
plo 1.1.5. Dica: Mostre que é possível escre- 
ver uma matriz jacobiana válida no domínio 
xo >0e outra para o domínio x, < 0. 


1.4. Mostre que o resultado do Exemplo 1.1.6 
não se altera se fossem consideradas as so- 
luções: zi(t) = sente zo(t) = —cost e 
y(t) = —sent e ya(t) = — cost. 


1.5. Mostre que o homeomorfismo h no 
Exemplo 1.1.6 não preserva a orientação do 
sistema de coordenadas. 


1.6. Encontre os pontos fixos do sistema 
(Sprott, 1994): 


L=Yy 
v=-—-z+yz (1.36) 
2=1-y 


e simule-o a partir da condição inicial (x,y, 2) = 


(0, 0,0). 


1.7. Encontre os autovalores de (1.30) e de 
(1.31). 


1.8. Seja o sistema? 


L= 4y" — 7? 
À MEG (1.37) 


Com relação a esse sistema pede-se: 


1. simule o sistema a partir da condição 


inicial [x(0), y(0)| = (0,0); 


2. localize os pontos de equilíbrio, deter- 
mine a estabilidade linear (local) e faça 
o diagrama de fases em torno de cada 
um deles; 


3. a partir dos resultados do item anterior 
procure imaginar como é o diagrama de 
fases global; 


3(McCauley, 1988). Veja (Fiedler-Ferrara e 
Prado, 1994) para uma solução detalhada e comen- 
tada deste exercício. 


4. discuta se a simulação feita no primeiro 
item é consistente com o diagrama de 
fases global obtido. 


1.9. Seja o sistema 
t = aly— a — h(x)] 


y=2—-y+z (1.38) 
Ze = by ra 


mx+(mo—-m), v>1 
bit j= 4 Moe, | x |<1(1.39) 
mxz-—(mo—mi), v<-—l, 


em que mo = —+ my ER a=9,8 E, 
r = 0. Responda os mesmos quatro itens do 
exercício 1.8. 
1.10. Considere o sistema de Róssler (Rós- 
sler, 1976) 
L=—y—Z 
y =x+ay (1.40) 
Z& =b+z(x—c), 


sendo que (a,b,c) são constantes. Seja a fun- 
ção O, : IRº(x,y,2) > Rj(X,Y,Z) 


X=y 
d,=| Y=24 ay (1.41) 
Z=av+(a— Dy-—s. 


Determine se o retrato de fases composto por 
(x,y,2) é, ou não, topologicamente orbital- 
mente equivalente ao retrato de fases com- 
posto por (X,Y, Z). &, é um difeomorfismo? 
Repita o exercício para 


Z=-b(ce-a)+(x—c)z—yz— 22. 

(1.42) 

Tomando os valores (a, b, c) = 

(0,2, 0,4, 5,7), gere por simulação órbitas 

em (x,y,2) e(X,Y,Z), tanto para &,, como 
para 6,. Discuta seus resultados. 


1.11. Considere o Exemplo 1.3.2, em parti- 
cular o resultado mostrado na equação (1.33). 
Comente sobre as limitações de se aumen- 
tar o ganho K, tanto quanto fosse necessário, 
para garantir convergência sempre. 


1.12. A equação do oscilador de Van der 
Pol é (Van der Pol, 1926): 


E+u(r?-NDz+2=0. (1.43) 


Represente o sistema em espaço de estados 
(x,y), em que t = y. Simule o sistema — 
isso envolve um procedimento de integração 
numérica — a partir de condições iniciais não 
nulas, mas próximas à origem do espaço de 
estados. Faça gráficos das variáveis de estado 
em função do tempo e do plano de fase para 
um valor de ju dentro de cada faixa: u < —2, 
-2<u<0,0<u<2eyu>2. Comente as 
diferenças observadas. Encontre os pontos fi- 
xos desse oscilador e classifique-os de acordo 


com a sua estabilidade. Comente esses resul- 
tados à luz das simulações realizadas. 


1.13. Seja a equação de Duffing-Ueda (Ueda, 
2001): 


t+Hkz+ x = u(t). (1.44) 


Represente o sistema em espaço de esta- 
dos (x,y), em que x = y. Simule esse sistema 
para k = 0,1, w = lrad/se u(t) = Acosuwt, 
para os seguintes casos 4 = 4, 4=5eA=6. 
Use condições iniciais nulas. Escolha o in- 
tervalo de integração ó, de tal maneira que 
a função forçante u(ô,k) = Acoswó,k, k = 
0,1,2,... seja periódica. Discuta como a es- 
colha de dó, pode influenciar a periodicidade 
de u(ô:k). Faça gráficos das variáveis de es- 
tado ao longo do tempo e o plano de fase 
para cada valor de 4. Nos gráficos, des- 
preze o regime transiente. Procure descre- 
ver (classificar o regime dinâmico em cada caso. 


1.14. Simule o sistema de Róssler (10.26) 
para a=0,398; b=2,c=4, x9=[0,1 0,1 0,1/" e 
tel0 200], use o passo de integração ót=0,01. 
Faça o gráfico da trajetória resultante no es- 
paço de estados desprezando-se o transiente, 
ou seja, deseja-se ter uma ideia do conjunto 
limite w para esse sistema com os parâmetros 
indicados. 


1.15. Considere os sistemas (Monteiro, 2006): 


tj =—19 ps W => 
Ty = 11 yo = —y. 


Esboce o plano de fase para ambos os sis- 
temas; determine se há equivalência topoló- 
gica orbital; determine o homeomorfismo h e 
mostre que o mesmo não preserva a orienta- 
ção do sistema de coordenadas. Neste caso 
há difeomorfismo global que preserva a dire- 
ção das órbitas? 


Capítulo 2 


Sistemas Dinâmicos 
Discretos 


Este capítulo é o análogo em tempo discreto 
ao capítulo anterior, que foi dedicado a siste- 
mas em tempo contínuo. Ao longo da expo- 
sição, as principais diferenças entre as repre- 
sentações em tempo contínuo e discreto são 
enfatizadas. Algumas definições equivalentes 


às dos sistemas em tempo contínuo são omi- 
tidas. O leitor pode achar esses detalhes nas 
referências mencionadas ao final do capítulo. 


2.1 Solução de Mapas 


Um mapa unidimensional pode ser represen- 
tado da seguinte maneira 


Tk =— F(xp-), (2.1) 


em que x, €E Re k = Z. No presente livro 
usamos a nomenclatura x, para indicar o k- 
ésimo valor da variável x. Em livros de pro- 
cessamento de sinais e controle, por exemplo, 
x é indicado por «x[k) (ou x[n|) e a(k), res- 
pectivamente. Não é incomum interpretar k 
como uma medida adimensional de “tempo”. 
Entretanto, mais corretamente, k é o número 
da iterada do mapa F. Por exemplo, xg in- 
dica a oitava iterada do mapa F. 


Exemplo 2.1.1 


Como exemplo de mapa, consideremos 
o modelo populacional de Maltus x, = 
UXk:-1, em que x, é o número de indi- 
víduos da k-ésima geração e u é a taxa 
de crescimento. Supondo que u = 11 
— indicando que qualquer geração é 10% 
maior que a anterior — e que 79 = 1, tem- 
se 


dy = À 

ae ag 

oc lr QU jul Zi 
me Dino QU an 


No exemplo acima, a condição incial é 
xo = 1 e a k-ésima iteração do mapa F re- 
sulta na k-ésima iterada, xp. Note que xx = 


F'(xo). A sequência de iteradas 7, k = 
0,1,...,00 é uma trajetória (solução) do mapa 
(ud: 


Exemplo 2.1.2 


Uma das dificuldades conceituais com o 
modelo populacional de Maltus x, = 
ULk-1, |! > 1 é que ele prevê que a ge- 
ração dos filhos é sempre mais numerosa 
do que a dos pais, a despeito das con- 
dições, como por exemplo, a disponibili- 
dade de alimento. Não é difícil ver que 
esse modelo está conceitualmente errado, 
pois à medida que uma população cresce 
os recursos vitais per capita tornam-se 
cada vez mais escassos e, eventualmente, 
chegar-se-á ao ponto em que, por falta 
de tais recursos, a população passará a 
diminuir, ao invés de aumentar. 

Uma maneira de incluir esse efeito no 


modelo é, mantendo a parcela que des- 
creve o crescimento xy, (u > 1), adici- 
onar uma outra parcela que force a popu- 
lação a diminuir se ela for grande, e que 
faça pouco efeito, se for pequena. Um 
modelo com tais características é o mapa 
logístico 


tp — Elm) tes neo 
uTr-a(l — xp), (2.2) 


em que a parcela — ux? | tem pouco efeito 
se a população (x. 1) for pequena e di- 
minui (notar o sinal negativo) a geração 
dos filhos, tanto mais quanto maior for 
a geração dos pais. Mesmo para yu > 1 
(u < 4), o mapa (2.2) não diverge (ver 
Exercício 2.1). O mapa logístico foi in- 
vestigado de forma detalhada por Robert 
May em uma época em que o comporta- 
mento caótico ainda não havia sido bem 


caracterizado (May, 1975; May, 1976). 
Tal mapa serviu como paradigma e teve 
uma influência perceptível para o desen- 
volvimento dessa área. Por fim, é im- 
portante salientar que o mapa logístico é 
uma aplicação do segmento unitário so- 
bre sim mesmo, ou seja, F : [0,1] > 
[o 


Um mapa multidimensional pode ser re- 
presentado da forma 


Th =— Pipa); (2.3) 


em que x, E IR”,e FPF: Rº5S Rº. O 
mapa (2.3) pode ser reescrito de maneira de- 
talha como 


em que x; = [xixê...axr]” é o vetor de es- 
tado no instante k. Portanto, a matriz jaco- 
biana do mapa (2.3) é definida como 


oF, oF, 9H, 
Ora Mbps Os 
0H, 0H, 0H, 


Dre drm: dm OP | AZ) 


or, 0F, OF, 
Or q Obra Ms 


A solução de um mapa n-dimensional 
pode ser obtida de forma análoga ao caso uni- 
dimensional, como pode ser visto no próximo 
exemplo. 


Exemplo 2.1.3 


O mapa bi-dimensional 


( tp=1-a(ze 1) + Yo (2.6) 


Wu Obi 


é conhecido como o mapa de Hénon (Hé- 
non, 1976). Para esse mapa, tem-se que 
gp = [x, yr) "EIR?. Escolhendo-se as con- 
dições iniciais zo = [0,5 0,5]" e os pará- 
metrosa=1,4e b= 0,3 tem-se 


m=1-14(z9)2+y = 1,15 
Yi — 0,3 sb) — 0,15 


Ly — 1-— 1,4 ui +Y =— —0,702 
Yo — 0,3 abit = 0,345 


As sequências x, e yp para k = 
0,1,...,200 são mostradas na Figura 2.1 
e o espaço de fases do mapa de Hénon 


está mostrado na Figura 2.2 (ver Exercí- 
cio 2; 


x x x 
xxx x 
Xe, xXx xXx, 
Tex x xs x x 2 ; R 
* x % x x MS Ze x 
E a x HEM mx 2% a: 
x É Com x x x 4x Wo xxx * 
0 x * Ad 
Ex x 
x x Vo x 
x x 
x x x 
x x Se » x x*» x x 
xx xx x 
+ x Ds E ER 
* x x 


RO e DSO O a 


x 
x xx Emas LN x Pai 
rss Tea Pee 


0 50 100 150 200 


FIGURA 2.1: Dados do mapa de Hénon. 
(a) 24 à 2200 e (Db) y1 à ago. 


A matriz jacobiana do mapa de Hé- 


non é 


DF(x,) = | Rs E | ; 


em que o fato de DF(x;,.) não ser cons- 
tante confirma que esse mapa é não li- 
near. 


= 0 


“aces 


-0,1 
-0,2 


-0,3 


dis 4 05 9 05 1º 15 


FiGURA 2.2: Espaço de fases do mapa 
de Hénon. Mil iteradas do mapa de Hé- 
non no espaço de fases, também conhe- 
cido como o atrator de Hénon. 


2.1.1 Gráficos de teia 


Uma das grandes diferenças práticas entre os 
mapas e fluxos, ou seja, campos vetoriais de 


sistemas em tempo contínuo é a maneira com 
que são simulados numericamente. Ao passo 
que a simulação de sistemas em tempo contí- 
nuo, em geral, envolve a integração numérica 
das respectivas equações diferenciais, a simu- 
lação de mapas consiste em, simplesmente, 
determinar as sucessivas iteradas do mesmo. 
No caso x = F(x,-1), basta tomar uma con- 
dição inicial xo para obter x, = F(xo). Na 
iteração seguinte, o resultado da iteração an- 
terior, 114, aparece como argumento do mapa 
para determinar x, = F(x,), e assim suces- 
sivamente. 


Uma maneira gráfica de ilustrar a si- 
mulação de mapas unidimensionais é obtida 
utilizando-se os assim chamados gráficos de 
teia. Para isso, coloca-se x, 4 no eixo das 
abcissas e x, no das ordenadas. Nesse sis- 
tema de coordenadas o mapa F(-) pode ser 
representado, normalmente de maneira sim- 
ples. 


Para entender como um gráfico de teia 
é útil na representação da simulação de ma- 
pas, note que uma iteração é composta de 
duas etapas. Primeiramente, tem-se a re- 
alimentação do resultado da iteração ante- 
rior no (domínio do) mapa e, em segundo 
lugar, tem-se a etapa de propagação, quando 
o mapa é efetivamente operado sobre o valor 
recém-realimentado, gerando a imagem. As- 
sim, vê-se que a realimentação corresponde 
a substituir x, | — xy. Graficamente isso 
pode ser facilitado utilizando-se a bissetriz, 
x; = v,-1, do sistema de coordenadas cons- 
truído, e tomando-se projeções, como ilus- 
trado a seguir. 


Considere o mapa de Maltus xp = up 
e as respectivas iteradas calculadas no Exem- 
plo 2.1.1. Deseja-se representar a referida 
sequência de iteradas graficamente. Primei- 
ramente, constroi-se o sistema de coordena- 
das e nele representa-se o mapa F(x). Isso 


está mostrado na Fig.2.3a. A seguir, toma- 
se a condição inicial xo. À primeira iterada, 
x = F(xo), pode ser obtida graficamente 
projetando-se a condição inicial até a fun- 
ção F, lendo o resultado sobre o eixo das 
ordenadas. O valor lido é 7. A iteração 
seguinte, é uma repetição da primeira, com 
a diferença de que parte-se de 714, em vez de 
xo. Graficamente, isso corresponde a rebater 
(horizontalmente) o valor x, sobre a bisse- 
triz e projetá-lo (verticalmente) sobre F, ob- 
tendo, assim, o resultado da segunda iterada, 
Ty — F (21). 


(a) (b) 


F(x 
x, (x) xd gi 
eua tens sedia /] 

| 249 RR EP e 
Xop-- Xg |--== =. nn nn º 
Xy|---., PAR Xp. o 

Xj . 
— ; ; 
XoXj XX E 0 1 2 3 k 


FIGURA 2.3: Exemplo de gráfico de teia. (a) 
Gráfico de teia do mapa 1; = uXk-1, UL DI, 
e (b) a respectiva sequência de iteradas. 


O procedimento descrito no parágrafo an- 
terior pode ser continuado indefinidamente. 
A sequência “temporal” das primeiras três 
iteradas é mostrada na Fig. 2.3b, e revela que 
essa sequência diverge, o que é esperado da- 
das as características do modelo de Maltus. 


Note-se que a sequência de iteradas pode 


ser representada da seguinte maneira 


vt = F(...F(F(xo))) 
k vezes 
= Ft(x9), k=0,1,...,00, (2.7) 
Ft =FoFo...oF, 


k vezes 


sendo que o indica a composição de funções e 
to = F(O(x9). A expressão (2.7) mostra que 
a simulação de um mapa consiste na aplica- 
ção recursiva de F(-) sobre a condição inicial, 
xo. Com essa informação, procure resolver o 
Exercício 2.6. 


Exemplo 2.1.4 


O conjunto de pontos que não se alteram 
com a aplicação do mapa F é dito inva- 
rante com respeito ao mapa. Assim, um 
determinado ponto % é invariante sob a 


ação de F se 


ms alo infinito) intima 
= ——— 


k vezes 


Tais conjuntos de pontos serão deno- 
minados pontos fixos, o que é detalhado 
na próxima seção. 


2.1.2 Conjugação Topológica 


Na Seção 1.1.3 o conceito de equivalência to- 
pológica orbital foi relacionado à existência 
de homeomorfismos ou diffeomorfismos que 
preservam a direção relativa das órbitas de 
sistemas em tempo contínuo. Na presente se- 
ção será apresentado o conceito análogo para 
o caso de mapas. 

Sejam dois mapas PF: Rº > Rºe 
G:Rº > Rº tais que suas iteradas se- 
jam relacionadas por um homeomorfismo h : 


Rº > IR”. Diz-se que F e G são topologi- 
camente conjugados se 3Jh|Goh = hoF, 
sendo que o indica a composição de fun- 
ções. Em termos de funções, a condição para 
conjugação topológica pode ser escrita como 
G(h(:)) = h(F(:)) e ilustrada como indicado 
na Figura 2.4 (Jackson, 1989, p. 181, vol. 1). 


Lo 


h(xo) h(xs) 


Lo z1 


F(xo) 


FIGURA 2.4: Ilustração esquemática de con- 
jugação topológica. x; X; E Rº,i = 
0,1. A condição para conjugação topológica, 
G(h(xo))=h(F(x9))=Z1, se verifica. 


2.2 Pontos Fixos 


No caso contínuo, o conjunto de pontos fi- 
xos de um fluxo é o lugar geométrico no es- 
paço de fases em que o campo vetorial é nulo. 
Isso significa que se escolhermos um ponto 
fixo para ser a condição inicial de um sis- 
tema autônomo, o mesmo não se move, uma 
vez que não há qualquer velocidade associ- 
ada à condição inicial e, portanto, o sistema 
se mantém fixo naquele ponto. 

Por analogia, para o sistema discreto (2.1) 
os pontos fixos Z são as soluções de 


= R(s): (2.8) 


ou seja, são os valores para os quais o sis- 
tema permanece fixo (invariante) mesmo sob 
a acao-dómapas Ty Ts tre ns E. 
Portanto, pontos fixos de F são invariantes 


sob a ação desse mapa, assim como os pontos 


fixos de um fluxo são invariantes sob a ação 
do respectivo campo vetorial. 


Por razões discutidas no Capítulo 4, às 
vezes é utilizada a denominação pontos perió- 
dicos no lugar de pontos fixos, para o caso de 
mapas. Essa nomenclatura não é universal e 
é perfeitamente comum referir-se aos pontos 
periódicos de um mapa simplesmente como 
sendo seus pontos fixos. 


No caso do modelo populacional de Mal- 
tus mencionado no Exemplo 2.1.1, o ponto 
fixo é a solução de x = ux. Como u £0,u 
1 — para evitar os casos triviais, tem-se que 
o único ponto periódico é o trivial 7 = 0. 
Nesse aspecto, não há diferença entre siste- 
mas lineares contínuos e discretos. Ambos 
têm apenas um ponto fixo. Além disso, se os 
sistemas forem autônomos, tal ponto fixo é a 
origem do espaço de estados. 


Por outro lado, mapas não lineares po- 
dem ter pontos fixos diferentes de zero, bem 


como podem ter mais de um ponto fixo, como 
ilustrado no próximo exemplo. 


Exemplo 2.2.1 


Os pontos fixos do mapa logístico (2.2) 
são dados pela solução da equação algé- 
brica x = ux(1 — x). Claramente To = O 
é uma solução, sendo que a outra é 

õ 1 

dq = 1--. 

uu 

Percebe-se, portanto, que o ponto fixo T1 
da equação logística depende do valor do 
parâmetro |, sendo que a posição do ou- 
tro ponto fixo é sempre a mesma. Deve 
ser observado que para valores deu < 1 0 
ponto fixo não trivial está fora do domí- 
nio do mapa logístico que é o segmento 
unitário x € [0, 1] (ver Exemplo 2.1.2). 


Um procedimento gráfico para determi- 
nar a localização de pontos fixos de mapas 
unidimensionais pode ser facilmente compre- 
endido utilizando o gráfico de teia, discutido 
na Sec. 2.1.1. Note que nesse gráfico, a igual- 
dade x, = %,-1 corresponde à bissetriz. Por- 
tanto, substituir x, — Te xp, — X em 
um determinado mapa F(-) e resolver para 
%, graficamente, corresponde a procurar a in- 
terseção de F(:) e a bissetriz, que é dada por 
Xp = %,-1, conforme ilustrado na Fig. 2.5. 


Xk- 


FIGURA 2.5: Localização geométrica de pon- 
tos fixos. Graficamente, os pontos fixos cor- 
respondem à interseção entre a bissetriz e a 
função (mapa) F. Nesta figura, há dois pon- 
tos fixos: %o, cuja posição independe de u e 
%, que depende de yu. Lembre-se que neste 
exemplo F = uxp-a(l— xp-1). 


Exemplo 2.2.2 


Os pontos fixos do mapa de Hénon são 


os valores (Z,y) que satisfazem 
ve l>no ad 
= bz. 
Substituindo-se a segunda equação na pri- 
meira chega-se a 
ar +(1-b)z-1=0 


que tem soluções: 


no (b-D+v(1-b)2 + 4a 

i 2a 

(b—-D)—-(1-b)2+4a 
2a : 


a = 


eparaa=14eb=õO03temsez' = 
0,6313 e 77 = —1,1314. Além disso, 


como à = bx, os pontos fixos são: 


q Doca peso eoap 
a [7 y|"=[-1,1314 — 0,3394]". 


| 
II 


Como esperado, os pontos fixos no caso 
do mapa bi-dimensional de Hénon são 
pontos no espaço IR?. 


Exemplo 2.2.3 


No Exemplo 2.1.4 foi introduzido o con- 
ceito de pontos fixos, como sendo pontos 
invariantes sob a ação do mapa F. Neste 
exemplo desejamos generalizar esse con- 
ceito. 

Suponha que sob a ação de um mapa 
F a sequência de iteradas alterne, em es- 
tado estacionário, entre dois valores fixos 


af e x”. Assim, uma trajetória em es- 
tado estacionário — nesse caso também é 
uma órbita — pode ser representada como 


RES RT O SD RU ET a O] 


Nesse caso, é claro que nem x* nem 
a” são pontos fixos de F, pois qt 
F(xt) ea”  F(x7). Contudo note que 
ambos são pontos fixos do mapa com- 
posto F(F(x,)) = F(x,). Note que 
q mira e 


no int ant as) 
tt = F(1) = F(F(x!)) = FO(a*). 


Portanto, de (2.10) fica evidente que tanto 
xt como x” são pontos fixos de FP). mas 
nenhum deles é ponto fixo de F. Para 
generalizarmos essa observação devemos 


notar que a órbita indicada em 2.9 é pe- 
riódica com período 2, pois a cada duas 
iteradas a sequência se repete. Indicando 
por O, uma órbita de período 2 do mapa 
F, as relações (2.10) mostram que os va- 
lores que compõem O», são (dois) pontos 
fixos de FO. 

Generalizando tem-se o seguinte: seja 
O, uma órbita periódica com período p 
do mapa PEC ci 
As p iteradas distintas que compõem O, 
são p pontos fixos do mapa F(?), pois 
Tm no) ve O,, que também são 
chamados de pontos periódicos. Se O, é 
uma órbita periódica com período 1 do 
mapa F (o que equivale dizer que O, é 
um ponto fixo de F) então O, também 
é uma órbita com período p e, portanto, 
um ponto fixo de F(?, Yp. 


2.3 Estabilidade de 
Pontos Fixos 


A análise de estabilidade de pontos periódi- 
cos (estabilidade local) em mapas é análoga 
à respectiva análise feita para pontos fixos de 
campos vetoriais (ver Sec. 1.2.2). Para facili- 
tar o estudo, os casos unidimensional e bidi- 
mensional serão considerados em sequência. 


2.3.1 O caso unidimensional 


Suponha que % seja um ponto fixo do mapa 
unidimensional F em (2.1). Tal ponto fixo é 
assintoticamente estável se uma sequência de 
iteradas começando na sua vizinhança, X-+%o, 
em que O < do < 1, convergir para esse 
ponto. Analogamente, % é denominado ins- 
tável se a referida sequência de iteradas di- 
vergir. 

O comportamento das iteradas em uma 


vizinhança de % pode ser caracterizado, ana- 
lisando o mapa F na vizinhança do ponto fixo 
x. Como feito para o caso contínuo, o mapa 
F pode ser expandido em série de Taylor em 
torno do ponto periódico % 


F(xp-1) = F(x) + 
OF 


er 2 
E (x:-1— T)+0º,(2.11) 


Tk-1=& 


em que O? indica potências de grau 2 e su- 
perior da diferença (x, 1 — X) e não deve ser 
confundido com uma órbita de período 2, Os, 
definida ao final da seção anterior. A Eg. 2.11 
descreve o mapa F em torno de %. Deseja- 
se saber o que acontece com uma condição 
inicial em uma (pequena) vizinhança de %, 
x +61, 0 < der < 1. Assume-se que, 
localmente, F pode ser considerado linear. 
Assim, usando o princípio da superposição, 


escreve-se 


F(xt+ópa) = F(x) + F(dp-) 


Note que para valores fora da vizinhança (va- 
lores grandes de 6), em geral não é possível 
desprezar o caráter não linear de F e, por- 
tanto, a expressão (2.12) não é válida em ge- 
ral. 


A pergunta a responder é se as iteradas 
que têm origem em Z+d-1 se aproximam, ou 
se afastam de %. Em outras palavras, deseja- 
se saber se |+| é menor ou maior que [0p-1|. 
Para isso, usamos a expansão (2.11) e o resul- 
tado (2.12) para avaliar a ação do mapa F, 


localmente, sobre X+ 6-1. Portanto, tem-se 


OF 
F(x+0k-1) = F(x) 3 (Z+ôp-1—T) 
Tk—l1 Tk-j=T 
oF 
T+ôp = T+ dk—1 
ÓXxk-1 ru SE 
OF 
ôk: ”S 5) Ók-1 — A dk-1:(2.13) 
Tk—1 Lp-1=E 


O escalar À em (2.13) determina a esta- 
bilidade de x. Se —-1I< A< 1, então |ók| < 
|0:-1| e, portanto, aplicando-se o mapa a um 
ponto na vizinhança de % resulta em um ou- 
tro ponto ainda mais próximo. Isso indica 
que a sequência de iteradas tende assintoti- 
camente ao ponto fixo, em outras palavras 


lim F%(z+d)>E,|ôo]|<1 (2.14) 
—00 


e tal ponto é (assintoticamente) estável. Além 
disso, para o caso em que O < À < 1, não é di- 
fícil ver que a convergência em (2.14) ocorre 


de maneira monotônica, conforme ilustrado 
na Fig. 2.6b. 


Considerando-se o mapa F na vizinhança 
do ponto fixo %, pode-se escrever a sequência 
de iteradas como 


de= FO(69) = Aº60, |09|<1, k=1,...,N, 
(2.15) 


sendo que N está limitado a valores tais que 
d; permanece pequeno. Supondo que do > 0, 
a expressão (2.15) deixa claro que se À < 0, 
as iteradas ó, consistem de valores com sinais 
algébricos alternados, pois a k-ésima iterada 
é positiva se k for par e negativa se k for 
ímpar. Essa sequência, portanto, alterna os 
valores em torno do ponto fixo. Além disso, 
se-I< A< 0, a sequência alternada ocorre 
de forma convergente, conforme ilustrado na 
Fig. 2.6c e Fig. 2.6d (ver Exercício 2.8). 


(b) (d) 


Ae Jeje Convergência à alternada 
convergência monotônica 


E Rn E Fa: é = = 
od 55 do BNB 5 


FiGURA 2.6: Pontos fixos estáveis. Os grá- 
ficos (a) e (c) representam o mapa F em 
uma vizinhança de pontos fixos x. Em (a) 
e(b)0<A<1, sendo À = 9F/dx, o que 
resulta em convergência monotônica. Em (c) 
e(d) -1<A<0ea convergência ocorre de 
maneira alternada. A convergência em am- 
bos os casos é assintótica, pois |dx| < |ôk-1|. 


Resumindo, se |A| < 1 diz-se que o ponto 
fixo é assintoticamente estável, ese |A| > 1 


o mesmo ponto é instável. Se À > 0, o com- 
portamento do mapa na vizinhança do ponto 
fixo é monotônico, mas se À < 0 o comporta- 
mento é alternado. Se |A| = 1, o ponto fixo é 
não hiperbólico e é necessário considerar al- 
guns termos adicionais de O? para determi- 
nar sua estabilidade. No caso de À = 1 fala- 
se de comportamento neutro, ese À = —1 
diz-se que o mapa está em um estado de flip 
incipiente. 


A fim de analisar o caso em que À é com- 
plexo, é necessário considerar o caso bidi- 
mensional, uma vez que sempre que a matriz 
jacobiana apresentar autovalores complexos, 
estes aparecem em pares conjugados, pois 
assume-se que os coeficientes do mapa são 
reais. Antes de considerar o caso bidimen- 
sional, a estabilidade local no caso do mapa 
logístico é analisado no próximo exemplo. 


Exemplo 2.3.1 


Como visto no Exemplo 2.2.1, os pontos 
fixos do mapa logístico (2.2) são zo = O 
ez; =1-—1/u. Neste exemplo, deseja-se 
determinar a estabilidade de tais pontos. 
A condição de estabilidade assintótica de 
um ponto fixo % é 


oF 


Ox Tk-1=% 


—1 < < Il. 


ou seja, o único autovalor de DF (x), que 
é real, deve estar entre -1 e 1. Para o 


caso do mapa logístico (2.2) tem-se 


of 9 
= ps há 

RA u UXk-— 

oF = 

OB | = E 

OF 

= = p=R 

Óxp-1 lop=t-1/m 

O ponto fixo xo = O é assintotica- 


mente estável para —1<u<1. Somente 
valores positivos de |y devem ser conside- 
rados caso se deseje interpretar o mapa 
logístico como um modelo populacional. 
Por outro lado, a condição de estabili- 


dade do ponto fixo x, =1-—1/u é 


= 
=D 6 =p = 
Ee eo (2.16) 


É interessante notar que (2.16) deter- 
mina dois limites de estabilidade. Para 
u>1 o ponto fixo x=1-1/u torna-se 
estável, sendo que para u=1 o ponto 
fixo é não hiperbólico, pois nesse ponto 
9F/d1x=1. Também, para u>1 o ponto 
fixo Z=0 torna-se instável. Ou seja, com 
a passagem de u por 1, o ponto fixo 
trivial perde estabilidade e o ponto fixo 
não trivial ganha estabilidade. Para u>3 
o ponto fixo z=1—1/y torna-se instável 
também, sendo que para u=3 esse ponto 
é não hiperbólico, pois 0F/dr=-1. 
Ainda que o ponto fixo Z=( perca es- 


tabilidade para yu > 1 e o ponto fixo 
z=1-1/u perca estabilidade para u>3, 
isso ocorre de maneira diferente, como in- 
dicado pelo sinal algébrico da derivada. 
No Capítulo 3 é visto que os fenôme- 
nos associados à perda de estabilidade 
em cada um dos casos citados acima são 
diferentes (ver Exercício 2.9). 


2.3.2 O caso bidimensional 


À linearização, em torno de % = [x y]” de um 
sistema discreto não linear bidimensional 


Th = (Xp, Yp-1) 

2 Ná 

À Yk — Clau); ( 

pode ser feita expandindo (2.17) em série de 
Taylor, em torno de %, como feito para o caso 
contínuo (ver Sec. 1.3). No caso discreto tem- 


se. 


OF 
mn = Pads (1-5) 
Th apa, ye 1)=(Z,9) 
oF 
à (10) + OZ 
Vk-1 apa, ye )=(2,9) 
OG 
Yk = GL, (xa-1—5) 
Th ap, ye 1)=(Z,9) 
OG 
à (yp-1—7) + OG. 
Yk=1 apo, yr 1)=(2,9) 


Como (x,y) é um ponto fixo do mapa, 
então Tx = F(z,y) ey = G(x,y). Definindo- 
se novas variáveis dk =X: —TXenM=Yyp—y, 
tem-se 


dk = poi k-1+ SE Mk-1 + o: 
Oxp-1|(a,9) dy |(a,9) 
o oC 
AD dp-1+ 2 na + Of 
UCk-1 (2,9) Yk-1 (2,9) 


Por fim, usando notação de vetor de es- 
tado as duas últimas expressões podem ser 
escritas como 


OF oF 
[à E OB Oyp-i ii fro: 
Mk OG OG Mk—1 
OB Oyp-1 (%,%) 
ex — DF(x) ex 1 +02, (2.18) 


em que DF(x) é a matriz jacobiana do sis- 
tema avaliada no ponto fixo Z e ex = [dk nk]”. 
À parte linear de (2.18) é e, = DF (x) ex 1, 
cuja estabilidade, como no caso contínuo, de- 
pende dos autovalores da matriz DF (x). En- 
tretanto, como visto anteriormente, a condi- 
ção de estabilidade de sistemas discretos não 
é determinada pela parte real dos autovalores 
de DF(x), mas pelo seu módulo. 
Suponhamos que os autovalores de DF (x) 
sejam A, e À». Isso significa que A, e À» são 


os valores de À que satisfazem a condição 
det DF(x) - AI] =0, (2.19) 


em que det|:| indica o determinante e 1, no 
presente exemplo, é a matriz identidade de 
dimensão 2. Esses autovalores podem ser re- 
ais ou complexos conjugados. 

A condição de estabilidade assintótica é 
que todos os autovalores de DF(x) estejam 
estritamente dentro da circunferência de raio 
unitário, ou seja, |A;| < 1,% = 1,2. Se pelo 
menos um autovalor estiver sobre a circun- 
ferência, isso é, |A;| = 1 para qualquer va- 
lor de à, o ponto fixo % é dito não hiperbó- 
lico. Ainda que os demais autovalores este- 
jam dentro da circunferência de raio unitário, 
a análise de estabilidade requer que sejam le- 
vados em conta termos de mais alta ordem 
na expansão de Taylor. Basta que um auto- 
valor tenha módulo maior do que a unidade 
e o ponto fixo em questão é instável. 


No caso de À, e Às serem reais, ambos 
podem ser positivos, com módulos maiores 
ou menores que um. Nesses casos os pontos 
fixos são nós instáveis e estáveis, respectiva- 
mente e são extensões simples do caso unidi- 
mensional analisado na Sec. 2.3.1. No caso de 
algum autovalor negativo, o comportamento 
alternado acontece na direção definida pelo 
respectivo autovetor e, novamente, o leitor é 
referenciado à Sec. 2.3.1 para detalhes. 

No caso de autovalores complexos, A 2 = 
o + 39, eles sempre aparecem em pares 
conjugados se todos os elementos da ma- 
triz DF(x) forem reais. Para analisar esse 
caso de maneira mais clara, a parte linear 
de (2.18) é reescrita como 


Um [> = [Urei 

[n)= [a Ii) em 
sendo que os autovalores da matriz em (2.20) 
são A12 = 0 + j 9), como desejado (ver Exer- 


cício 2.11). Como o sistema (2.20) é de se- 
gunda ordem, o respectivo espaço de estado 
pode ser representado no plano (w,v). Para 
representar o movimento do sistema nesse 
plano, é conveniente imaginar que se trata 
do plano complexo (isso é apenas um arti- 
fício matemático) e o ponto [uy vw)” nesse 
plano pode ser escrito na forma de uma va- 
riável complexa 2; = uk + j vp. Usando-se 
(2.20), pode-se escrever 


% = cupi— Qua +HI(D Upa tok) 
o (upa + Vea) + 9 Mu + j Vk-1) 
(o +50) (upa + jura) 

E ia (2.21) 


Expressando as duas entidades complexas 
em (2.21) em coordenadas polares, usando 
2w="rpe'?s, resulta em 


mw = V02+ Mer, ele 
sa (vo + 02 ra) eitn-1+O) (92.99) 


sendo que 4 = tan *(0/0). Comparando-se 
(2.22) com 2p=rpe?**, conclui-se que 


Tk = (242) Tea 


(2.23) 
0). = 0-1 + tan! ia 
o 


À primeira equação em (2.23) mostra que 
o módulo de 2, diminui de uma iterada para a 
seguinte se o módulo dos autovalores A, » for 
menor que a unidade, isso é se v02 +02 <1. 
Por outro lado, o ângulo de zy sofre incre- 
mentos constantes iguais a q) a cada itera- 
ção. Isso significa que no plano (w,v) as ite- 
radas formam uma espiral. Sev02 +02 <1, 
fala-se de um foco estável ou sorvedouro ou, 
ainda, poço, por outro lado se 02 +02 >1 
o foco é instável e é chamado de fonte. 


Exemplo 2.3.2 


No Exemplo 2.2.2, os pontos fixos do mapa 


de Hénon com parâmetros a = 1,4 e b= 
0,3 foram determinados: 

qu Dou [063120 18940 
Papo mpb pero na cis 


| 


Neste exemplo queremos encontrar a es- 
tabilidade desses pontos fixos. Para isso, 
usamos a matriz jacobiana para o mapa 
de Hénon, que foi encontrada no Exem- 
plostrs: 
—2Zazxp 1 


avaliada nos pontos fixos. Portanto tem- 


- do O OR 
DE(D)lr,=a* — | 03 E 
x 3,1679 1 

DH(Z)lg, = | 0.3 0) | 


Os autovalores da matriz jacobiana 
avaliada em X! são: AT = —1,9236 e 
AZ = 0,1560, portanto esse ponto fixo é 
uma sela. Os autovalores da matriz jaco- 
biana avaliada em Z” são: À, = 3,2599 
e A = —0,0920, que também é uma 
sela e, por definição, instável. Ao simu- 
lar o mapa de Hénon no Exemplo 2.2.2 
constatou-se que o mapa para os valores 
de parâmetros utilizados é globalmente 
estável. Não há contradição no resul- 
tado obtido, uma vez que a estabilidade 
de pontos fixos é unicamente estabilidade 
local e não determina a estabilidade glo- 


bal no caso de sistemas não lineares. 


Leitura Recomendada 


Diversos aspectos da teoria discutida neste 
capítulo podem também ser encontrados em 
(Monteiro, 2006; Fiedler-Ferrara e Prado, 
1994) em língua portuguesa e em (Gucke- 
nheimer e Holmes, 1983; Wiggins, 1990), em 
língua inglesa. 

O primeiro estudo detalhado sobre a equa- 
ção logística foi publicado na revista Nature 
por Robert May (May, 1976). Esse celebrado 
artigo recebeu mais de 1700 citações indexa- 
das ao longo de três décadas. Uma análise 
detalhada do mapa logístico pode ser encon- 
trada em diversos livros, como por exemplo 
em (Fiedler-Ferrara e Prado, 1994; Sprott, 
2003). 

Outro mapa igualmente comum na litera- 


tura de sistemas dinâmicos não lineares é o 
mapa de Hénon (Hénon, 1976). 


Exercícios 


2.1. Simule o mapa logístico mostrado na 
Eg.2.2 para u = 3,1 e condição inicial to- 
mada no intervalo O < x, < 1. Como clas- 
sificaria a solução obtida em estado estacio- 
nário? 


2.2. Reproduza a Fig. 2.2. 


2.3. Faça uma figura análoga à Fig. 2.3 para 
o mapa %k = uXk-1, 4 < 1. Que diferença 
qualitativa você observa entre a sua figura e 
a Fig. 2.32? 


2.4. Volte a considerar o Exercício 2.1, mas 
resolva-o utilizando o gráfico de teia. Com- 
pare os novos resultados com aqueles obtidos 
por simulação. 


2.5. Determine a posição e o valor em que 
aparece o ponto de máximo na parábola as- 
sociada ao mapa logístico. O que ocorre com 
a parábola para u > 4? Usando o gráfico de 
teia procure antecipar o que ocorre se esse 
mapa for simulado para ju > 4? 


2.6. Seja o mapa x, = uXp 1 = F(xp), 
com uy = 1,1. Determine as iteradas, e faça o 
respectivo gráfico de teia, de FO (x, 1), k= 
1,2,3, a partir da condição inicial xy = 1. 
Como se relacionam essas iteradas com as 
iteradas do mapa F(xy 1)? 


2.7. Mostre que se F e G são mapas to- 
pologicamente conjugados então F(?) e G() 
também o são. 


2.8. Faça uma figura análoga à Fig. 2.6 
para os casos AÀ>1eA<-—l. 


2.9. Simule o mapa logístico (2.2) para 
“= 0,95, u= 1,05 e yu = 3,1. Compare o 
comportamento em cada caso e descreva as 
diferenças qualitativas observadas. 


2.10. Considere o mapa logístico x = 
F(xe-1) = u(l-x;-1)xk-1. Encontre o mapa 
FO). Determine seus pontos fixos com a res- 
pectiva estabilidade. Use esse resultado para 
analisar o comportamento do mapa logístico 
para u = 3,1 considerado no item anterior. 
Faça o diagrama de teia para o mapa xp = 
FO) (xk-2). 


2.11. O sistema (2.20) pode ser obtido, 
aplicando-se a matriz de transformação 7 à 
parte linear de (2.18) tal que 


Ea = Ra] (2.24) 


Po DF(x)o1 O — DF(x)s 
0 Q É 


em que DF(x);; indica o elemento (i,5) 
da matriz jacobiana avaliada no ponto fixo 
DF(x). Mostre que os autovalores da matriz 
em (2.20) são A, = 0 +30. 

2.12. Em 1978, René Lozi propôs o mapa 


À rp=1-alzea]+ yr 


RE Dea (225) 


conhecido como o mapa de Lozi (Lozi, 1978). 
Comparando esse mapa ao de Hénon (2.6), 
nota-se que Lozi simplesmente trocou (xp. 1)? 
por |xk-1|. Determine a localização e a esta- 
bilidade dos pontos fixos de (2.25). Classi- 
fique os pontos fixos de acordo com sua es- 
tabilidade. Simule o mapa para a = 17e 
b = 0,5, que são os valores usados por Lozi, a 
partir da condição inicial (x9,yo) = (0,0) por 
11.000 iteradas. Despreze as primeiras 1.000 
iteradas e represente as demais (use pontos) 
no espaço de estados. Compare seu resultado 
gráfico com a Figura 2.2. 


Capítulo 3 


Bifurcações de 
Pontos Fixos 


Pontos fixos, ou pontos de equilíbrio, e ci- 
clos limite são conjuntos assintóticos. No 
caso de serem estáveis tais conjuntos podem, 
por exemplo, representar o comportamento 
de um sistema em estado estacionário. 


Como visto na Seção 1.2, um ponto fixo é 


estável se órbitas na vizinhança de tal ponto 
não divergem para o infinito. Um procedi- 
mento análogo pode ser imaginado para se 
definir e testar a estabilidade de um ciclo li- 
mite, nesse caso fala-se de estabilidade orbi- 
tal. Um ciclo limite é assintoticamente es- 
tável se órbitas vizinhas convergem para o 
referido ciclo. 


Tanto no caso de pontos fixos quanto no 
caso de ciclos limite, a estabilidade menci- 
onada está associada ao comportamento do 
sistema para condições iniciais diferentes, 
próximas do ponto fixo ou do ciclo limite em 
questão. 


Um outro cenário pode ser considerado no 
qual, ao invés de se tomar condições iniciais 
diferentes para avaliar a estabilidade de pon- 
tos fixos ou ciclos, investiga-se a estabilidade 
desses conjuntos assintóticos à medida que se 
perturba a equação diferencial. Nesse caso, 
fala-se de estabilidade estrutural. A perda de 


estabilidade estrutural é chamada de bifur- 
cação e implica uma mudança qualitativa da 
dinâmica do sistema. A seguinte citação é 
bastante instrutiva nesse particular: 


“Se um sistema físico, que 
consiste de um fluido viscoso 
e de corpos sólidos, não for 
submetido a nenhuma ação ex- 
terna, ele converge para um 
estado de repouso (equilíbrio). 
Submete-se o sistema a uma ação 
constante (bombeamento, aque- 
cimento, etc.), e se supõe que 
se possa quantificar o compor- 
tamento por um parâmetro |. 
Quando u = 0, o fluido está 
em repouso. Para yu > 0, pri 
meiramente obtém-se um estado 
fixo [diferente do repouso], ou 
seja, os parâmetros físicos que 
descrevem o fluido em qualquer 


ponto (velocidade, temperatura, 
etc.) são constantes no tempo, 
mesmo o fluido não estando em 
repouso. Esse cenário de es- 
tados fixos prevalece para valo- 
res pequenos de ju. Ao se au- 
mentar |, vários fenômenos no- 
vos ocorrem: (a) o fluido pode 
permanecer em um estado esta- 
cionário constante, mas pode ter 
seu padrão de simetria alterado, 
(b) o movimento do fluido pode 
se tornar periódico no tempo, 
(c) para valores de yu suficiente- 
mente grandes, o movimento do 
fluido torna-se complicado, irre- 
gular e caótico, temos turbulên- 
cia” (Ruelle e Takens, 1971). 


Essa citação é mencionada por dois moti- 
vos. Em primeiro lugar, ela descreve qualita- 
tivamente um cenário de bifurcações em um 


fluido em movimento. Em essência, o que os 
autores dizem nesse trecho é que à medida 
que se muda um parâmetro (41) do sistema, o 
comportamento altera de forma qualitativa. 
Em segundo lugar, o trecho acima é o pa- 
rágrafo inicial da introdução do artigo que 
ficou famoso por ter sido o primeiro a utili- 
zar o termo caótico, para descrever compor- 
tamento determinístico complexo. O artigo 
On the Nature of Turbulence é, sem dúvida, 
um dos marcos na assim chamada teoria do 
caos. 


Este capítulo descreve algumas bifurca- 
ções de pontos fixos para sistemas em tempo 
contínuo, na Sec. 3.2 e discreto, na Sec. 3.3. 
Tais bifurcações serão provocadas pela vari- 
ação de um parâmetro do sistema, denomi- 
nado de parâmetro de bifurcação, que alguns 
autores chamam de parâmetro de controle. 


Antes de entrar propriamente na descri- 
ção de algumas bifurcações, na próxima seção 


é ilustrado o conceito de mudança qualitativa 
da dinâmica (bifurcação) em dois sistemas: o 
oscilador harmônico e o pêndulo simples. 


3.1 Mudança Qualitativa 
de Comportamento 


O objetivo da presente seção é prover uma in- 
trodução intuitiva ao assunto de bifurcações 
de pontos fixos. Para esse fim, são conside- 
rados dois exemplos que foram estudados em 
detalhe no Capítulo 1. A análise mais formal 
desse assunto é realizada nas seções 3.2 e 3.3. 


Exemplo 3.1.1 


Consideremos novamente o oscilador 
harmônico cujo comportamento diná- 
mico é descrito pela equação diferencial 
(1.4). Assumindo inicialmente que não 


há amortecimento, ou seja, y = 0, as raí- 
zes da equação característica são pura- 
mente imaginárias e iguais a À = Ejwo, 
ver Eq. 1.9. 

Em se tratando de um sistema linear 
autônomo, o oscilador em questão tem 
apenas um ponto fixo, que se encontra 
na origem do plano de fases. Como os 
autovalores do sistema — os autovalores 
de um sistema linear observável e con- 
trolável coincidem com as raízes da cor- 
respondente equação característica — são 
puramente imaginários, À = +jwo, dize- 
mos que o ponto fixo é um centro. 

Perturbando o amortecimento de ma- 
neira a ter O<y<l1, percebe-se (ver 
Eq. 1.9) que nesse caso os autovalores 
do sistema passam a ser complexos com 
parte real negativa e, portanto, diferente 
de zero. Nesse caso, à origem deixou de 
ser um centro para se tornar um foco es- 


tável. É fundamental perceber que essa 
bifurcação, caracterizada pela mudança 
de um centro para um foco, ocorrerá 
para qualquer valor de y40, não importa 
quão pequeno seja. Percebe-se, então, 
que para y=0 o sistema é estruturalmente 
instável, uma vez que qualquer pertur- 
bação em q resultará em uma mudança 
qualitativa da dinâmica. 

Para y > 0 a origem é um foco es- 
tável. O aumento de y afeta o compor- 
tamento do oscilador, pois este se torna 
progressivamente mais amortecido. En- 
tretanto, a partir desse ponto, o aumento 
de y resulta em uma mudança da dináã- 
mica que é apenas quantitativa, não qua- 
litativa. Ou seja, se y > 0, o aumento 
não resulta em uma nova bifurcação. Es- 
sas ideias estão ilustradas na Figura 3.1. 
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FigurA 3.1: Bifurcação no oscilador 
harmônico. A origem do plano de fases 
é um centro em (a) e é um foco está- 
vel tanto em (b) quanto em (c). Por- 
tanto, de (a) para (b) o sistema sofreu 
uma mudança qualitativa em sua diná- 
mica. Diz-se que o sistema sofreu uma 
bifurcação. Apesar de o comportamento 
dinâmico em (b) e (c) ser diferente, a di- 
ferença é apenas quantitativa e não qua- 
litativa. De (b) para (c) o sistema não 
sofreu uma bifurcação. 


Exemplo 3.1.2 


Retomemos o exemplo do pêndulo, mas 
agora incluamos um termo de amorteci- 
mento linear em (1.12) 


0=4 
v=-20y- sen. no 


Nesse caso, a matriz jacobiana passa 
a ser 


0 1 

de — cos 6 —20 
em que x = [9h]”. No ponto fixo (0,1) = 
(0,0), os autovalores de Df(ax) são da- 
dos pela solução de 2 +20 A+9/1=0, 


que é A = -o+v0cº-g/l. No caso 


subamortecido, 9/1 > o? os autovalores 


|. ca 


são ÀA= —o + j/g/l-02. Em ambos 
os casos, nota-se que sempre que o > 
0, o ponto fixo (0,4) = (0,0) é está- 
vel, ao invés de ser um centro, como é 
no caso em que o = 0. O retrato de fases 
para o pêndulo amortecido é mostrado 
na Figura 3.2. Note a mudança estru- 
tural sofrida com respeito ao retrato de 


fases mostrado na Figura 1.5. 
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FIGURA 3.2: Retrato de fa- 
ses para o pêndulo amortecido. 
A bifurcação dos pontos fixos 


(km,0), = ..,—3,-11,93,0m de- 
terminou uma mudança estrutural no 
fluxo. Compare esta figura com a 


Figura 1.5. O pêndulo em x» tem maior 
energia total do que nas condições inici- 
ais o) € x4, razão pela qual o pêndulo 
dá duas voltas antes de oscilar em torno 
do ponto fixo estável e repousar. 


Por outro lado, os autovalores de 
Df(x) avaliados em (0,1h)=(7,0) são 
ÀA=—-0c+302+g/l. Portanto, (9,4) = 


(7,0) é um ponto de sela tanto para 
oc=0 quanto para o>0. Sendo assim, di- 
zemos que oc=( é uma condição de bi- 
furcação para o ponto fixo (0,)=(0,0), 
pois para o>0, esse ponto fixo deixa de 
ser um centro. Por outro lado, o=0 
não é um ponto de bifurcação para o 
ponto fixo (0,4)=(7,0) pois permanece 
um ponto de sela, independente do va- 
lor de o. Outra forma de fazer a mesma 
afirmação é dizer que para o=0, o ponto 
fixo (0,)=(7,0) é estruturalmente está- 
vel, ao passo que (0,1))=(0,0) não é. 


Portanto, dizemos que um sistema é es- 
truturalmente estável se mudanças arbitrari- 
amente pequenas no campo vetorial não alte- 
ram qualitativamente o retrato de fases. Dito 
de outra maneira, se os retratos de fase an- 
tes e depois da perturbação do campo veto- 
rial forem topologicamente equivalentes, esse 


campo vetorial é estruturalmente estável. 


3.2  Bifurcações Locais em 
Sistemas Contínuos 


Nos dois exemplos considerados na seção an- 
terior, pode ser observado que as condições 
para y = 0 (ver Exemplo 3.1.1) eo = 0 
(ver Exemplo 3.1.2) são estruturalmente ins- 
táveis. À razão para isso é o fato de que tão 
logo esses parâmetros assumem valores dife- 
rentes de zero (qualquer que seja o valor do 
módulo), o tipo de comportamento do res- 
pectivo sistema passa a ser qualitativamente 
diferente. 

Uma outra observação importante é que 
em ambos os casos tais parâmetros coincidem 
com a parte real dos autovalores das respec- 
tivas matrizes jacobianas, avaliadas em um 
ponto fixo. Como discutido abaixo, a mu- 


dança da parte real de pelo menos um auto- 
valor — da matriz jacobiana avaliada em um 
ponto fixo — de zero para qualquer outro va- 
lor indica a bifurcação desse ponto fixo. 

A maneira convencional de abordar o as- 
sunto de bifurcação de pontos fixos é por 
meio da análise das formas normais, que são 
campos vetoriais simplificados que tipificam 
o tipo de fenômeno (bifurcação) em estudo. 


3.2.1 Bifurcação sela-nó 


A forma normal da bifurcação sela-nó ou tan- 
gente ou ainda de dobra, supercrítica é: 


t=u—r. (3.3) 


Os pontos fixos da equação normal (3.3) 
são dados pela solução de z=0=u-— 22, 
que é 7 = +,/u. Apenas pontos fixos re- 
ais são de interesse aqui, portanto requer- 
se que uy > O. A bifurcação sela-nó su- 


percrítica, portanto, está associada ao apa- 
recimento (criação) de um ponto fixo (para 
1850): 

Os pontos fixos de (3.3) não são constan- 
tes, mas dependem do parâmetro u.! A Fi 
gura 3.3a mostra o lugar geométrico dos pon- 
tos fixos da forma normal (3.3). 


A estabilidade desses pontos fixos pode 
ser avaliada por meio do sinal algébrico da 
derivada 0f/dx. Se Of/dx < O no ponto 
fixo, esse ponto é estável e se Of/dr > 0 
no ponto fixo, é instável. Se 9f/dx = O no 
ponto fixo, a equação normal é dita estru- 
turalmente instável e, nesse caso, diz-se que 
o ponto fixo passa por uma bifurcação, ou 
bifurca. Assim, para a equação normal (3.3) 


ISe (3.3) fosse linear (e continuasse sendo autô- 
nomo), o seu único ponto fixo seria constante e esta- 
ria na origem. 


e avaliando 0 f/da nos pontos fixos, tem-se: 


o bi 


(3.4) 
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FigurA 3.3: Bifurcação sela-nó supercrí- 
tica. Para u < Le = 0 a forma normal não 
tem pontos de equilíbrio reais. A partir de 
4 > te = O à forma normal apresenta um par 
de pontos fixos simétricos +./u, cujo lugar 
geométrico está mostrado em (a). O ponto 
fixo +,/ju é estável ao passo que —,/u é ins- 
tável, que é indicado por linha tracejada em 
(b). As setas indicam o sentido do fluxo. 


A'solução real 


e : | 


Portanto, o ponto fixo 7 = +.,/u é estável 
para |! > 0, pois nesse caso —2,/u < 0. Se- 
melhantemente, percebe-se que o ponto fixo 
x = —./u é sempre instável desde que ju > 0. 
Está claro que o ponto de bifurcação acon- 


tece para o valor crítico ue = 0, pois nesse 
caso Of/dz = 0. O diagrama de bifurca- 
ção da equação normal (3.3) é mostrada na 
Figura 3.3b. O ponto x = 0 e yu = 0 é cha- 
mado de ponto de retorno, ponto limite, na- 
riz ou joelho (Fiedler-Ferrara e Prado, 1994, 
p. 48). Esse ponto tem uma peculiaridade: 
soluções originadas em x(0) > O convergem 
para ele, ao passo que as soluções origina- 
das em x(0) < O divergem dele. Ou seja, de 
um lado desse ponto de equilíbrio verifica-se 
convergência enquanto do outro, divergência. 
Diz-se que o ponto fixo x = 0 é semi-estável. 


A forma normal da bifurcação sela-nó sub- 
crítica é: 


t=u+s, (3.5) 


sendo que o lugar geométrico dos pontos fixos 
e o diagrama de bifurcação são mostrados na 
Figura 3.4 (ver Exercício 3.2). 
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FIGURA 3.4: Bifurcação sela-nó subcrítica. 
Para u > ue = O a forma normal não tem 
pontos de equilíbrio reais. A partir de u < 
le = O a forma normal apresenta um par 
de pontos fixos simétricos +,/—, cujo lugar 
geométrico está mostrado em (a). O ponto 
fixo —/—y é estável ao passo que +,/— é 
instável, indicado por linha tracejada em (b). 
As setas indicam o sentido do fluxo. 


3.2.2 Bifurcação transcrítica 


A forma normal da bifurcação transcrítica é: 


= ur. (3.6) 


Procederemos à análise nos mesmos mol- 
des seguidos para a bifurcação sela-nó. Os 
pontos fixos da equação normal (3.6) são da- 
dos pela solução de x=0=a(u — x). Por- 
tanto, T=0 ex = | são os pontos fixos (um 
constante e outro dependente do parâmetro 
tt), conforme mostrado na Figura 3.3a. 

A estabilidade desses pontos fixos pode 
ser avaliada por meio do sinal algébrico da 
derivada 0f/0x. Para a equação normal (3.6), 
a derivada é 


of Our — a?) 
— =u—? 
Ox Ox é ni 
que, avaliada nos pontos fixos, resulta em 

Of 
da [5-0 E 
4d EE 
6/07] E E SUA 


Portanto, o ponto fixo 7 = 0, com autovalor 
4t, é estável para u < 0, ao passo que o ponto 


fixo Z = |1, com autovalor —p, é estável para 
4 > 0, como mostrado no diagrama de bifur- 
cação da Figura 3.5b. Para uy = 0 o ponto 
fixo é semi-estável. 
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FIGURA 3.5: Bifurcação transcrítica. A bi 
furcação ocorre em fic = O quando há uma 
troca de estabilidade. O ponto fixo na ori- 
gem perde estabilidade, e o ponto fixo em 
x = | ganha estabilidade. (a) lugar geomé- 


trico e (b) diagrama de bifurcação. As setas 
indicam o sentido do fluxo. 


3.2.3 Bifurcação forquilha 


A forma normal da bifurcação forquilha su- 
percrítica é: 


= ue. ENA 


Como antes, começamos determinando a 
localização dos pontos de equilíbrio. Os pon- 
tos fixos da equação normal (3.7) são da- 
dos pela solução de x = 0 = x(j — 12). Por- 
tanto, à semelhança da bifuracação transcrí- 
tica, a origem é sempre um ponto fixo, ou 
seja, X = 0. Os outros dois pontos fixos são 
XY = +, como no caso da bifurcação sela- 
nó. O lugar geométrico dos pontos fixos de 
(3.7) é mostrado na Figura 3.6a. 
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FIGURA 3.6: Bifurcação forquilha supercrí- 
tica. A bifurcação ocorre em pr. = O quando 
o ponto fixo trivial perde estabilidade e um 
par de pontos fixos simétricos (estáveis) é cri- 
ado. (a) lugar geométrico e (b) diagrama de 
bifurcação. As setas indicam o sentido do 
fluxo. 


Avaliando-se 9f/dx para a equação nor- 
mal (3.7) tem-se 


2 


a 
of qua na 


Ox Ox 


Nos pontos fixos pode-se escrever 


of o 
id Do sa 
of 
dz = u—-du= —2u 
T=+yu 
Portanto, o ponto fixo trivial 7 = O é es- 


tável para uy < 0, ao passo que os pontos 
fixos T = +,/j serão estáveis para ju > 0, 
como mostrado no diagrama de bifurcação da 
Figura 3.6b. Deve ser notado que o par de 
pontos fixos simétricos reais não existe para 
u <0 (ver Exercício 3.7). 


3.2.4 Bifurcação supercrítica de 
Hopf 


A bifurcação de Hopf ocorre em duas dimen- 
sões. A primeira consequência desse fato é 
que para estudar tal bifurcação é necessária 


uma forma normal de duas equações de pri- 
meira ordem, conforme mostrado a seguir: 


i=-y+he(u— sy?) 
e a Ni 


Igualando as derivadas de (3.8) a zero, 
multiplicando a primeira equação por x, a se- 
gunda por y, e somando-se as equações obtém- 
se: 


O=(2+9)u-z —y'), (3.9) 


de onde segue que o sistema dinâmico (3.8) 
tem as seguintes soluções estacionárias (con- 
juntos limite w): (x,y) = (0,0), ou seja, a 
origem do plano vz x ye x? +? = u, OU seja, 
o círculo centrado na origem e com raio ,/jt. 
A matriz jacobiana é dada por: 


Dj(e) 1-2xy u— x" — 3y 


Df(o-a = [4 7], (3:10) 


sendo que, a matriz jacobiana foi avaliada 
no ponto fixo x = (0,0). Os autovalores de 
Df(x) são À= u+ j, em que j = v—1. Isso 
mostra que para | < O a origem do sistema 
(3.8) é um foco estável, ao passo que para 
u > 0, é um foco instável, como pode ser 
visto esquematicamente na Figura 3.7. 


FIGURA 3.7: Focos estáveis e instáveis. Para 
| < 0, a origem do plano (x,y) é um foco es- 
tável (negrito contínuo), que perde a estabili- 
dade ao passar por [te = O (negrito tracejado) 
e permanece instável para u > O. Quanto 
maior for |ji|, tanto maior é a taxa de con- 
vergência ou divergência. 


A Figura 3.7 mostra que para ju > 0 a ori 
gem torna-se instável. Caberia perguntar se 
a trajetória diverge até o infinito ou se fica 
confinada em alguma região finita do espaço 
IR2. Para responder a essa pergunta, não 
é possível lançar mão da matriz jacobiana 
Df(ax), pois ela tem validade local, apenas 
na vizinhança do ponto fixo %. Além disso, 


foi visto que o sistema dinâmico definido pe- 
las equações normais (3.8) tem outra solução 
estacionária, o círculo de raio ,/ju, onde não 
é possível avaliar a matriz jacobiana de uma 
só vez utilizando-se coordenadas cartesianas. 

A fim de abordar essa questão, a forma 
normal (3.8) é expressa em coordenadas po- 
lares, fazendo uso da seguinte transformação: 


[ v=r cos0 (3.11) 


y=r senô 


Tomando-se a derivada temporal de (3.11) 
obtém-se 


À &=+rcos0-rô send 


y=7 seng+rô cos) e) 


Substituindo (3.11) e (3.12) em (3.8), tem- 
se as equações normais em coordenadas po- 
lares 


7 cos0—r0 sen0=-—r sen0+r(u—r2)cos Ha 13) 
7» sen 0+r0 cos0=r cos0+r(u—r?)senO “O 


Igualando-se os coeficientes dos termos em 
cos0 (ou em sen6) em cada uma das equa- 
ções de (3.13), as equações normais em coor- 
denadas polares podem ser reescritas como: 


P=r(u-r?) 
| SA (3.14) 


Os pontos fixos de (3.14) podem ser obti- 
dos anulando-se a derivada do módulo r, na 
primeira equação. Assim, os pontos de equilí- 
brio são: r=0er=+tyu,u>o0, que são os 
mesmos encontrados anteriormente utilizando- 
se a representação em coordenadas cartesia- 
nas. Portanto a Eq. 3.14 é usada para aná- 
lise com u > 0. Dizer que o sistema tem 
ponto fixo em r = +Vt, u > O (não faz 
sentido considerar a raiz negativa) significa 
que para esse comprimento (módulo) do fa- 
sor, apesar de girar com velocidade angular 
constante (9 = 1), a derivada associada à 


divergência é zero. Para verificar a estabili- 
dade desse ponto fixo, procede-se como ante- 
riormente, ou seja, determina-se a “matriz” 
jacobiana 


= u—-3r 
DE H— Sr, 
que, avaliada no ponto fixo, resulta em 
ôr(u = 13) 
OE =u—Su= —2H. 
r=vH 


Como u > 0, esse ponto fixo é estável, 
o que significa que o módulo do fasor, que 
cresce para valores “pequenos” (pois a ori- 
gem é instável, como visto anteriormente), 
estabiliza em r = ,/u. Isso está ilustrado na 
Figura 3.8a. 

Um “ponto” fixo estável de (3.14) corres- 
ponde a um ciclo limite estável do sistema 
original (3.8). Isso significa que depois da 
bifurcação de Hopf, a origem (que tem di- 
mensão nula) perde estabilidade sendo que o 


sistema passa a se afastar da origem em mo- 
vimento espiral divergente (lembre-se que a 
origem é um foco instável após a bifurcação, 
veja Figura 3.7) até cair em um ciclo está- 
vel, de dimensão um, conforme ilustrado Fi- 
gura3.8b. Assim, a bifurcação de Hopf (su- 
percrítica) é uma bifurcação que dá origem 
a ciclos limite, razão pela qual a sua forma 
normal deve ser de dimensão 2. Por fim, 
chama-se atenção para uma das caracterís- 
ticas da bifurcação de Hopf: a matriz jaco- 
biana do sistema tem um par de autovalores 
puramente imaginários no ponto de bifurca- 
ção. 


FIGURA 3.8: Diagrama de bifurcação do tipo 
Hopf. (a) À origem é um foco instável. O mó- 
dulo de 7 cresce até atingir o valor r = ./H, 
que é um “ponto” fixo estável de (3.14), ou 
seja, um cilo limite estável do sistema ori- 
ginal (3.8). (b) Diagrama de bifurcação do 
tipo Hopf. O ponto fixo trivial perde esta- 
bilidade e um ciclo limite estável aparece em 
torno do ponto fixo. 


A bifurcação descrita nesta seção recebeu 
o nome do matemático e astrônomo austríaco 
Eberhard Frederich Ferdinand Hopf (1902- 
1983), que se naturalizou americano em 1947 


(Sprott, 2003, p. 164). Hopf estabeleceu as 
condições para a ocorrência da bifurcação 
que leva seu nome, mas não foi o primeiro a 
estudá-la. Antes dele, o matemático francês 
Henri Poincaré (1858-1912) sugeriu a exis- 
tência dessa bifurcação e o físico soviético 
Aleksandr Aleksandrovich Andronov (1901- 
1952) a estudou para sistemas bidimensionais 
e, portanto, às vezes é chamada de bifurca- 
ção de Poincaré-Andronov-Hopf (Monteiro, 
2006, p. 341). Da mesma maneira como a 
bifurcação de Hopf dá origem a um ciclo li- 
mite a partir de um ponto fixo que perde a 
estabilidade, é possível que uma segunda os- 
cilação (frequência) surja após a bifurcação 
de Hopf em sistemas de dimensão maior. O 
aparecimento de um toro bidimensional (in- 
dicado por T?) está associado a uma bifurca- 
ção secundária de Hopf ou bifurcação de Nei- 
mark (Fiedler-Ferrara e Prado, 1994, p. 57). 
A versão da bifurcação de Hopf para mapas 


é chamada de bifurcação de Neimark-Sacker 
(Sec. 3.24). 


3.2.5 Condições para 
bifurcações 


As formas normais (3.3), (3.6) e (3.7) cor- 
respondem, respectivamente, às bifurcações 
sela-nó, transcrítica e forquilha. É útil rees- 
crever essas equações de maneira a explicitar 
sua dependência com o parâmetro de bifur- 
cação |t, OU Seja, usaremos a representação 
x = f(x,y). Nos três casos, é fácil de verifi- 
car que, nos pontos de bifurcação, e = 0, as 
seguintes condições são atendidas: 
of 

7(0:0)-=0 e dE (0,0) = 0. (3.15) 

A primeira condição em (3.15) requer que 
(2,11) = (0,0) seja um ponto fixo, e a se- 
gunda, que o autovalor da respectiva “ma- 
triz” jacobiana 0f/dx avaliada nesse ponto 


fixo tenha um autovalor nulo. Como visto 
no próximo exemplo, as condições em (3.15) 
não são suficientes para se ter uma bifurca- 
ção. 


Exemplo 3.2.1 


Neste exemplo ilustra-se o caso de um 
ponto que apesar de ser não hiperbólico 
não apresenta bifurcação (Wiggins, 1990, 
prod 

Seja o campo vetorial dado por 


Ef u)-n>2, (816) 


que satisfaz às condições em (3.15). O lu- 
gar geométrico dos pontos fixos de f(x, [1) 
é dado pela solução de ju = x?, como ilus- 
trado na Figura 3.9. 


FIGURA 3.9: Ponto não hiperbólico sem 
bifurcação. A origem é um ponto fixo 
não hiperbólico cuja estabilidade não se 
altera em u=0. 


Para investigar a estabilidade, deve- 
se calcular 


df uz) 
dr Ox 


= =. 


Nota-se que apesar de (x, u) = (0,0) 
ser um ponto fixo não hiperbólico, a di- 
nâmica de (3.16) não muda qualitativa- 


mente quando |y passa pelo valor zero, 
sendo sempre estável. Em outras pala- 
vras, o campo vetorial (3.16) não sofre 
bifurcação, apesar de satisfazer as condi- 
ções em (3.15). Neste exemplo isso torna- 
se evidente ao perceber que o autova- 
lor associado ao ponto fixo não depende 
de ps. 


Uma vez que as condições em (3.15) não 
são suficientes para se ter uma bifurcação, 
deseja-se derivar tais condições, o que é feito 
a seguir brevemente. Detalhes do procedi- 
mento podem ser encontrados em (Wiggins, 
1990, pp. 258-269) e em (Monteiro, 2006, 
pp.328-335). 

O ponto fixo (x, 4) = (0,0) sofre uma 
bifurcação em yu = 0 se houver perda de es- 
tabilidade estrutural nesse ponto, de forma 
que o fluxo na vizinhança do ponto de bifur- 
cação é qualitativamente diferente do fluxo 


nesse ponto. 


Um resultado importante no desenvolvi- 
mento das condições para se ter a bifurcação 
de pontos fixos é o teorema da função im- 
plícita. No presente caso, esse teorema for- 
nece a condição para que exista uma função 
única yu = u(x), (0) = 0, definida para va- 
lores de x suficientemente pequenos, tal que 
Fla, u(x)) = 0. A condição fornecida pelo 
teorema é 


=(0,0)%0. (3.17) 


As condições para se ter uma bifurcação 


sela-nó são: 


f(9,0)=0, 
of 
dx 
of 
55 (9:0) 0, 
02 

55 (0,0) £ 0. 


== (0,0) =0, 
(3.18) 


As primeiras duas condições em (3.18) 
requerem, respectivamente, que o ponto 
(x, H)=(0,0) seja um ponto fixo, e que seja 
não hiperbólico. A terceira condição é 
dada pelo teorema da função implícita (ver 
Eq. 3.17) e garante que apenas uma curva 
(função) de pontos fixos passa pelo ponto de 
bifurcação (x, n)=(0,0). Por fim, a última 
condição em (3.18) garante que essa curva 
encontra-se inteiramente de um lado de u=0. 
A forma normal da Eq.3.3 atende a essas 
condições. 


As duas últimas condições em (3.18) po- 
dem ser obtidas a partir de f(x, u(x)) = 0. 
Diferenciando-se essa função em relação a x 
e lembrando que 


ou 


ao (0) = 0, (3.19) 


chega-se à terceira condição em (3.18). A 
Eq. 3.19 é a condição para que a curva de 
pontos fixos j(x:) seja tangente à linha u = 0 
em x = (0, o que pode ser visualmente verifi- 
cado das figuras 3.3 e 3.4. Diferenciando-se 
f(x, u(x)) = O duas vezes em relação a x, 
avaliando o resultado em (x, 4) = (0,0), e 
usando (3.19), chega-se à última condição em 
(3.18). Para as demais bifurcações, apenas as 
condições serão apresentadas. 


As condições para se ter uma bifurcação 


transcrítica são: 


H(0,0) =0, 

O o 

Be ld» 0) —. 0, 
of 
ou 
o2f 
dudr 
E 


art: (3.20) 


aan (0,0) £ 0, 


Com respeito à terceira condição em (3.20), 
deve ser notado que, pelo teorema da função 
implícita, corresponde ao caso em que não 
há uma única curva de pontos fixos que passa 
pelo ponto fixo. De fato, como pode ser ob- 
servado da Figura 3.5, duas curvas, x = 0 e 
ax = |, passam por (x, u) = (0,0). 

Por fim, as condições para se ter uma bi- 


furcação forquilha são: 


(0,0) =0, 

“/(0,0) =0, 

5: (0,0) =0, 

dei 9-0, (3.21) 
e (0,0) £0, 

0,0) 40. 


3.2.6 Análise do sistema 
de Lorenz 


Nesta subseção deseja-se ilustrar alguns dos 
conceitos vistos até aqui. Para isso utiliza- 
se um dos modelos icônicos da teoria de sis- 
temas dinâmicos não lineares, o sistema de 


Lorenz (Lorenz, 1963): 


t=o(y—a) 
Ú=rr-y—sz (3.22) 
Z=ery-ba 


Esse conjunto de equações foi original- 
mente proposto como um modelo reduzido 
para estudar o problema de convecção (Lo- 
renz, 1963).2 Aqui, a partir do estudo da 
auto-estrutura em torno dos pontos fixos de 
(3.22), são esboçadas algumas características 
do respectivo fluxo no espaço de fases. 

Em primeiro lugar, deseja-se localizar os 
pontos fixos desse sistema, portanto, fazendo 
t=y=2=0, tem-se 


Z = (T,9,2) = (0,0,0) 
To = (X2,92,22) = (+s, Er Cf 1) 


%s — (T3,9)3,23) 


(—s,—s,r — 1), 


2Uma descrição mais detalhada da derivação des- 
tas equações bem como sua interpretação física po- 
dem ser encontradas em (Monteiro, 2006). 


em que s = /b(r — 1). A coordenada x dos 
três pontos fixos são, portanto, 0, «/b(r — 1) 


e-—yb(r — 1). Parao = 10eb= So lugar 


geométrico da coordenada x desses pontos fi- 
xos é mostrado na Figura 3.10a. 


parte real dos autovalores complexos conjugados. 


autovalor real 


FIGURA 3.10: Sistema de Lorenz. (a) Lugar geo- 
métrico da posição dos três pontos fixos em função 
de r. Apenas a coordenada x é mostrada, sendo que 
(—) refere-se ao ponto fixo trivial, (---) refere-se ao 
ponto fixo TZ» e (- -) refere-se ao Ta. (b) parte real 
dos três autovalores associados a um dos pontos fi- 
xos não triviais. Devido à simetria, o diagrama (b) 
é válido para ambos os pontos fixos não triviais. Em 
r = 1 tais pontos fixos tornam-se reais e estáveis. Por 
volta de r = 1,4 dois autovalores deixam de ser reais 
para se tornarem complexos conjugados. (c) conti- 
nuação do gráfico (b) para outra faixa de valores de 
r. O par de autovalores complexos conjugados perde 
estabilidade por volta de 7 = 24,7. 


Note a disposição simétrica dos pontos fi- 
xos cuja posição permanece inalterada após 
uma rotação em torno do eixo 2. 

A seguir, a estabilidade local de cada ponto 
fixo é investigada. Para esse fim, deve-se ana- 
lisar os auto-valores da matriz jacobiana, que 


= o 0 
Df(e)= |r-z -1 -x |. (3.23) 
y go —b 


A estabilidade local do ponto fixo trivial 
é investigada avaliando-se a matriz jacobiana 
(3.23) nesse ponto, ou seja 


—o o 0) 
Df(z)= |r-z —1 —x 
y e b (x:,y,2)=(0,0,0) 
—0 O 0) 
= r —1 0 


Os autovalores de Df(x,) são, por de- 
finição, os valores de A que satisfazem 
det |Df(x1)-AI| = O em que det| - | indica 
o determinante e 1 é a matriz identidade de 
dimensão adequada. No presente caso, os au- 
tovalores de Df(%,) são 


—(o +1) e Vo + 1)2 +4(r — Do 
i 2 2 


Deve ser notado que os três autovalores 
acima estão associados ao (único) ponto fixo 
trivial. Como verificado, para este sistema a 
cada ponto fixo estão associados três auto- 
valores, pois o sistema é tridimensional. Os 
autovalores, portanto, não são três pelo fato 
de os pontos fixos serem três. 

As bifurcações de pontos fixos de siste- 
mas contínuos estão associadas à passagem 
de um de seus autovalores pelo eixo imagi- 
nário jw. No caso de autovalores reais isso 


equivale simplesmente à passagem por zero. 
Com isso em mente, deve ser observado que 
parar = 1 o ponto fixo trivial sofre uma bi- 
furcação, pois para esse valor de parâmetro 
tem-se: 


ue —(0 +1) A (o + 1)2 
k 2 2 
= tod) E (o +1) 
2 2 


o que resulta em 
Ai = 0, As = —(o + 1), As = —b, 


em que fica evidenciado que para r = 1 um 
autovalor é nulo. São considerados os seguin- 
tes valores de parâmetros o = 10 e b = E 
Parer<ld, A <Uz=123eparar>A, 
A >0eA<0, i=2,3. Assim, antes da bi- 
furcação o ponto fixo trivial é um nó estável 
e após a bifurcação torna-se uma sela. Além 
disso em r = 1 são criados dois pontos fixos 
simétricos, em +,/b(r — 1). 


A matriz jacobiana avaliada em um dos 
pontos fixos não triviais é 


—0 O 0) 
Djle = 1 1 -s |, (9:20) 
8 s —b 


que tem polinômio característico igual a: 


Alb o SEDA bloco + MAS 
+20b(r-1)=0. (3.26) 


Para r = 1 em (3.26), um dos autovalores 
é nulo. A Figura 3.10b mostra os autovalores 
A;, 4 = 1,2,3 para uma faixa de valores de r. 
Observa-se na figura que para 7 = 1 um au- 
tovalor se anula, como antecipado. Devido à 
simetria do sistema, a Figura 3.10b é válida 
para ambos os pontos fixos não triviais. Em 
r = 1 os pontos fixos não triviais tornam-se 
reais e estáveis (nós estáveis). Parar =x 1,4 
dois autovalores deixam de ser reais para se 
tornarem complexos conjugados, portanto os 


pontos fixos tornam-se focos estáveis. Isso é 
indicado na figura pela fusão das duas cur- 
vas, uma vez que a parte real de autovalores 
complexos conjugados é idêntica. Note que 
essa mudança de tipo de ponto fixo (não de 
sua estabilidade) não caracteriza uma bifur- 
cação. De fato, os campos vetoriais antes e 
depois do ponto 7 = 1,4 são topológica e or- 
bitalmente equivalentes. 


Prosseguindo nessa análise, aumentando- 
se o valor de r (ver Fig. 3.10c) a parte real 
do par de autovalores complexos torna-se po- 
sitiva para 7 = 24,7, resultando na perda 
de estabilidade dos pontos fixos não trivi- 
ais. Por outro lado, o ponto fixo trivial, con- 
forme visto em (3.24), continua sendo uma 
sela, com duas direções estáveis e uma instá- 
vel. 


Os gráficos (b) e (c) na Figura 3.10 mos- 
tram que parar = 1 er = 247 ocorrem 
bifurcações. A seguir as classificamos utili- 


zando os conceitos da Seção 3.2. Em r = 1 
o ponto fixo trivial perde estabilidade (ver a 
discussão que segue a Eq.3.24) e os pontos 
fixos não triviais, que são simétricos, ficam 
estáveis. Esse cenário é precisamente o da bi- 
furcação forquilha (ver Sec. 3.2.3). Para r = 
24,7 o par de autovalores complexos conju- 
gados em cada ponto fixo não trivial cruza o 
eixo imaginário no plano complexo, caracte- 
rizando, assim, uma bifurcação de Hopf sub- 
crítica (ver Sec. 3.2.4). Esse tipo de bifur- 
cação não resulta em órbitas estáveis, como 
é o caso da bifurcação de Hopf supercrítica, 
discutida na Seção 3.2.4. Na Figura 3.11 tre- 
chos transientes de trajetórias são mostrados 
para ajudar a visualização. 


1247: 
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FIGURA 3.11: Lugar geométrico de pontos fixos 
do sistema de Lorenz. Para r=1 o ponto fixo trivial 
perde a estabilidade e dois pontos fixos simétricos 
ganham estabilidade. À medida que r aumenta, es- 
ses pontos fixos afastam-se da origem e em 7r=24,7 
perdem a estabilidade via uma bifurcação de Hopf 


subcrítica. Valores dos parâmetros usados: 0=10 e 


À medida que se aumenta o valor de r 
ainda mais os pontos fixos não triviais são 
do tipo sela-foco e só há soluções aperiódi- 
cas, sendo que há evidências numéricas que 


indicam a existência de atratores caóticos 
(Fiedler-Ferrara e Prado, 1994, p. 107). 


A fim de tentar esboçar uma possível con- 
figuração para a estrutura do fluxo no espaço 
de fases, é importante observar qual é a auto- 
estrutura na vizinhança de cada ponto fixo. 
Resumindo os resultados que foram obtidos 
até aqui tem-se (ver Figura 3.12): 


FiGURA 3.12: Estrutura do espaço de fa- 
ses do sistema de Lorenz. Diagrama esque- 
mático da estrutura do espaço de fases do 
sistema de Lorenz para o = 10, b = 5 e 
r = 28. Observa-se que órbitas na vizinhança 
do ponto fixo trivial são atraídas e logo eje- 
tadas de forma não oscilatória, e que órbitas 
em torno dos pontos fixos não triviais evol- 


vem em torno deles de forma oscilatória. 


1. o ponto fixo trivial é um ponto de sela 


com dim[W*|=2 e dim[W"|=1, sendo 
que todos os autovalores são reais; 


2. os pontos fixos não triviais são instáveis 
também mas dim[W*|=1 e dim[W"|=2, 
sendo que os autovalores instáveis são 
complexos conjugados. 


As variedades instáveis dos pontos fixos 
não triviais são subespaços de dimensão dois 
ao passo que a variedade instável do ponto 
fixo trivial é de dimensão um. Como os au- 
tovalores instáveis nos pontos fixos não trivi- 
ais são complexos conjugados, o movimento 
ao longo da variedade instável desses pon- 
tos fixos é oscilatória (espiral divergente) em 
torno deles. Quando uma órbita se afasta (de 
maneira oscilatória) de um dos pontos fixos 
não triviais, ela se aproxima das variedades 
estáveis do outro ponto fixo não trivial ou 
mesmo do ponto fixo trivial, sendo atraído 
por uma delas. Ao chegar à vizinhança do 


novo ponto fixo, a órbita sofre a influência da 
variedade instável do referido ponto fixo e se 
afasta do mesmo. Se for o ponto fixo trivial, 
o movimento se dá de forma não oscilatória 
(Figura 3.12). 


Por fim, a Figura 3.13 mostra um trecho 
de órbita do sistema de Lorenz. Note como 
o comportamento de tal órbita no espaço de 
fases é coerente com a estrutura ilustrada na 
Figura 3.12, que foi determinada a partir da 
análise local dos pontos fixos. 


FIGURA 3.13: Atrator caótico de Lorenz. 
Órbita do sistema de Lorenz para o=10, b=5 
e r=28. Note-se como a órbita desta figura 
segue a estrutura determinada pela análise 
local dos pontos fixos e que foi ilustrada na 
Figura 3.12. 


Tais resultados servem para mostrar que, 
em alguns casos, não é necessário resolver 
a equação diferencial não linear para se ter 


uma ideia da organização das órbitas no plano 
de fases. Essa organização é a representação 
geométrica das oscilações no tempo que são 
determinadas pela dinâmica do sistema. O 
conceito de atratores caóticos e não caóticos 
é abordado no Capítulo 4. 


3.3  Bifurcações de Pontos 
Fixos em Mapas 


Nesta seção são abordadas algumas bifurca- 
ções de pontos fixos em mapas. Alguns ma- 
pas têm bifurcações que são análogas às estu- 
dadas em tempo contínuo, mas a bifurcação 
do tipo flip é peculiar a mapas. Detalhes 
podem ser encontrados em (Monteiro, 2006). 

O procedimento geral para analisar as 
bifurcações em mapas é análogo ao se- 
guido no caso contínuo, ou seja, i) toma- 
se a forma normal da bifurcação em estudo, 


ii) determina-se a localização dos pontos fi- 
xos, iii) determina-se o lugar geométrico dos 
pontos fixos em função do parâmetro de bi- 
furcação e iv) faz-se a análise de estabili- 
dade dos pontos fixos. Esse procedimento 
é mostrado a seguir para as bifurcações su- 
percríticas, as bifurcações análogas suberíti- 
cas são propostas como exercícios (ver Exer- 
cício 3.11). 


3.3.1 Bifurcação sela-nó 


A forma normal da bifurcação sela-nó, tam- 
bém conhecida como bifurcação tangente, 
para mapas é 


te= Tp duo Th = (xe, p), (3.27) 
em que |; é o parâmetro de bifurcação (ver 


Exercício 3.8). Os pontos fixos de (3.27) po- 
dem ser encontrados fazendo-se x = Lk-1 = 


x e resolvendo para %, ou seja, 


=+yj. (3.28) 


Para valores negativos de | não há pon- 
tos fixos reais. Para yu > 0, o lugar geomé- 
trico de (3.28) é mostrado na Figura 3.14a. 
Em u = 0 ocorre a criação de ponto cha- 
mado de ponto de retorno (Fiedler-Ferrara e 
Prado, 1994, p. 48) a partir do qual emergem 
dois pontos fixos, um estável e outro instável. 
É comum dizer-se que a bifurcação sela-nó 
é uma bifurcação pela qual pontos fixos são 
criados. 


(a) 5 O 


! u 


dá 
pes 


FIGURA 3.14: Bifurcação sela-nó para ma- 
pas. Para u<pi=0 não há pontos de equilí- 
brio reais. À partir de y>uç=0 à forma nor- 
mal apresenta um par de pontos fixos simé- 
tricos +,/u, cujo lugar geométrico está mos- 
trado em (a). O ponto periódico +.,/u é es- 
tável para O<u<1 e —./u, indicado por linha 
tracejada em (b), é sempre instável. As setas 
indicam o sentido das iteradas (ver Exercí- 
Gloss 


x 
A'solução real Ê 


Hc E | 


Como visto na Seção 2.2, a condição de 


estabilidade é dada por 


of 


<l 
O xp Tk-1=T 


E! DR 


Sds pas = (3.29) 


=2:< =20:/0) <0 
1>=/p>0: 


Portanto, para o braço de pontos fixos 
negativos, —/j, não há valores de | tais 
que (3.29) seja satisfeita. Por outro lado, 
os pontos fixos positivos são estáveis desde 
que ju < 1. Esse resultado está resumido na 
Figura 3.14b. 

A origem da denominação bifurcação tan- 
gente encontra-se no fato de que esse tipo 
de bifurcação ocorre quando a função F tan- 
gencia a bissetriz no plano (xy. 1, x), onde é 
desenhado o gráfico de teia (ver Seção 2.1.1). 


Exemplo 3.3.1 


Um conhecido exemplo de mapa que passa 
por uma bifurcação tangente é o mapa 

logístico (ver Exemplo 2.1.2). Para u = 

1+'8 = 3,8284927... esse mapa passa por 

uma bifurcação tangente na qual surge 

uma órbita periódica de período 3 (Sprott, 
2003, p. 166). Essa bifurcação é também 

ilustrada na Figura 3.37. 

Como detalhado na Seção 3.3.4 (veja 
também o Exemplo 2.2.3), uma órbita de 
período mn pode ser analisada por meio 
do mapa Ft), que é a aplicação, n ve- 
zes, do mapa sobre si mesmo. | Por- 
tanto, a órbita de período 3 pode ser 
estudada observando-se o mapa PF) — 
FFP (as, pu)]). Em particular, a órbita 
de período 3 do mapa F corresponde a 
três pontos fixos do mapa FW, Esse 
mapa para o valor yu = 3,82 está mos- 


trado na Figura 3.15. 

Note que, como u < ue =1+ 8, 
a bifurcação tangente ainda não ocorreu. 
Contudo, é possível perceber que à me- 
dida que u for gradualmente aumentado 
até seu valor crítico tc, O mapa F (8) se 
deformará até tangenciar a bissetriz nos 
três pontos indicados pelas setas. No 
ponto de bifurcação ju = ft, Fº) tangen- 
ciará a bissetriz em 3 lugares distintos, 
gerando 3 pontos de dobra. Para valores 
H > e, à partir de cada ponto de dobra 
surge um ponto fixo estável e um instável 
(ver Figura 3.14). São esses três pontos 
fixos de F(*) que correspondem a uma ór- 
bita de período 3 estável de F e que pode 
ser claramente vista na Figura 3.37 para 
valores de ju um pouco maiores que o va- 
lor crítico. 

Um ponto importante a notar é que 
antes da bifurcação, o mapa F(*) passa 


próximo à bissetriz. Como consequên- 
cia, as iteradas que caírem nessa região 
podem levar bastante tempo para passa- 
rem pelo “gargalo” formado entre o mapa 
FCO) e a bissetriz, como ilustrado na Fi- 
gura 3.16. 
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FIGURA 3.15: Mapa FC) próximo a uma 
bifurcação tangente. As setas indicam os 
pontos em que o mapa ficará tangente à 
bissetriz na bifurcação. 
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FIGURA 3.16: Gargalo formado próximo 
à bifurcação tangente. Detalhe da parte 
central do mapa da Figura 3.15. Quanto 
mais estreito for o gargalo, mais iterações 
são necessárias para que a trajetória o 
percorra. 


As iteradas do mapa F, quando este 
estiver próximo de uma órbita de pe- 
ríodo 3, podem ser analisadas por meio 
do mapa composto F(), mostrado na Fi- 
gura 3.15. Quando o mapa F está pró- 
ximo de tal órbita corresponde à passa- 
gem de iteradas de FO) pelos três gar- 


galos formados logo antes da bifurcação 
tangente. Na Figura 3.16 é mostrado o 
gargalo central. Assim as iteradas de F 
aproximam-se da órbita periódica a ser 
gerada na bifurcação tangente. Esse re- 
gime é às vezes referido como sendo la- 
minar. Passado o regime laminar, a tra- 
jetória visita outras regiões do domínio 
de maneira “caótica” até retornar pró- 
ximo à órbita de período 3, quando o 
processo se repete. Esse tipo de com- 
portamento, ilustrado na Figura 3.17, é 
conhecido como intermitência do tipo T. 
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FIGURA 3.17: Intermitência do tipo I. 
Antes da bifurcação tangente é possível 
observar comportamento intermitente do 
tipo I. Nesta figura (ju = 3,8284) o gráfico 
em (b) é um detalhe de (a). 


O comportamento próximo à órbita 


periódica é chamado de laminar, em con- 
traste aos estouros (bursts em inglês) 
caóticos que ocorrem intermitentemente 
(Fiedler-Ferrara e Prado, 1994). Na fase 
laminar é possível distinguir que as ite- 
radas se alternam aproximadamente en- 
tre três pontos x, = 0,16, x, = 0,91 e 
x; = 0,95, que estão perto dos pontos 
periódicos (pontos fixos de F)) a serem 
criados em yu = 1+V8 = 3,8284927... 
A simulação cujos resultados são mos- 
trados na Figura 3.17 foi realizada com 
|! = 3,8284, ou seja, um pouco antes da 
bifurcação tangente ocorrer. 


3.3.2 Bifurcação transcrítica 


A forma normal da bifurcação transcrítica é 


Ze tra rurais F(zpa pu) (3.30) 


Os pontos fixos de (3.30) são as soluções 
da equação algébrica resultante da substitui- 
ção de x, = Xk-1 = X% na equação de diferen- 
ças (3.30). Portanto, 


Z=E+uT— 
0=(u— T)E. (3.31) 


Dizemos que a equação de diferenças (3.30) 
tem um ponto fixo trivial porque % = O sa- 
tisfaz a equação (3.31). Além do ponto fixo 
trivial, 7 = yu também satisfaz (3.31). Por- 
tanto, os pontos fixos são = 0e% = ueseu 
lugar geométrico é mostrado na Figura 3.18a. 
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FIGURA 3.18: Bifurcação transcrítica para 
mapas. Aumentando-se o parâmetro de bi- 
furcação de valores negativos próximos a zero 
para valores positivos, o ponto fixo trivial 
perde estabilidade no ponto de bifurcação 
=| € o ponto fixo não trivial ganha esta- 
bilidade. (a) Lugar geométrico dos pontos 
fixos. (b) Diagrama de bifurcação. As setas 
indicam o sentido das iteradas (ver Exercí- 
cio 3.9). 


DA 
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A condição de estabilidade é dada por 
op 
<1 
tp aaa (3.32) 
—1I<1l+u—?xpa] el 


Tk-1=% 


—1 < 


Para o ponto fixo trivial x = 0, a condi- 
ção (3.32) torna-se —2<<0 e para o não- 
trivial x = yu a condição de estabilidade é 
—-2<-u<0,ou seja, O< yu < 2, conforme 
ilustrado na Figura 3.18b. 


3.3.3 Bifurcação forquilha 
A forma normal da bifurcação forquilha é 


Cp =Up tu te —2h = F (gpa, 14) (3.33) 


Os pontos fixos de (3.33) são as soluções 
de 


3 


T=14+4UT— x 
0=(u— 5º)z. (3.34) 


Pelas mesmas razões vistas na bifurcação 
transcrítica, a equação de diferenças (3.33) 
tem um ponto fixo trivial Y=0. Um par de 
pontos, que também satisfazem (3.34), são 
t=+yu. O lugar geométrico desses pontos 
fixos é mostrado na Figura 3.19a. A condição 
de estabilidade é dada por: 


oF 
<1 
Ôtp-1 om (3.35) 
-I<l+u-3r<l. 


= a 


Para o ponto fixo x = (0 a condição (3.35) 
torna-se —2 < yu < 0, como no caso da bifur- 
cação transcrítica. Por outro lado, a condi- 
ção de estabilidade para os pontos fixos não 
triviais, que satisfazem T2 = up, C0<u<1, 
conforme ilustrado na Figura 3.19b. 
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FIGURA 3.19: Bifurcação forquilha para ma- 
pas. (a) Lugar geométrico dos pontos fi- 
xos. (b) Diagrama de bifurcação. As setas 
indicam o sentido das iteradas (ver Exercí- 
cio 3.10). 


De maneira análoga ao que foi apresen- 
tado para os campos vetoriais (ver Sec. 3.21), 
é possível escrever as condições para se ter 
uma bifurcação de forquilha em yu = 0, enun- 
ciadas abaixo. Detalhes sobre a obtenção 
de tais condições podem ser encontrados em 
(Wiggins, 1990; Monteiro, 2006). Em pri- 
meiro lugar, o mapa F dever ter um ponto 
fixo em Z = 0 e esse ponto fixo deve ser não 


hiperbólico, ou seja 


9H 
F(0,0)=0, e >—(0,0) = 1. (3.36) 
Or 
As condições para que esse ponto fixo so- 
fra uma bifurcação tipo forquilha são (ver 
Exercício 3.13): 


OF 


au 0) =0 

o2F 

ara (0,0) =0 

dr (3.37) 
aron (O DO 

FE 

973 (0,0) £ 0. 


Uma forma simplificada de interpretar es- 
sas condições é considerar o caso polinomial, 
que é o caso da forma normal (3.33). A pri- 
meira condição em (3.37) restringe F a não 
ter um termo que dependa somente de u. A 


segunda condição também impede que F te- 
nha um termo quadrático em x. As condições 
seguintes requerem que F tenha um termo 
cruzado — o produto — entre yu e x, bem como 
um termo cúbico em x. Com um pouco de 
reflexão é possível concluir que essas restri- 
ções garantem a simetria de pontos fixos, que 
caracteriza a bifurcação forquilha. 


3.3.4 Bifurcação flip 


A forma normal da bifurcação flip, também 
conhecida como bifurcação de duplicação de 
período ou sub-harmônica, é 


te=—Tpn—urp + or = F(xp,4). (3.38) 


Os pontos fixos de (3.38) são as soluções 
de 


Z=-E-uI+ E 
0=[5º — (2 + ulz, 


que tem soluções TZ =0ezx= +24. O 
lugar geométrico desses pontos fixos é mos- 
trado na Figura 3.20a. Note que o acréscimo 
de 2 dentro da raiz quadrada corresponde a 
trasladar o ponto de bifurcação para o ponto 
US 

A condição de estabilidade é dada por 


oF 
el 
O tp agaê (3.39) 
-I<-1l-u+37<1. 


mi! sá 


Para o ponto fixo 7 = (0 a condição (3.39) 
é -2< u<0, como no caso da bifurcação 
forquilha. Por outro lado, a condição de es- 
tabilidade para o par de pontos fixos não tri- 
viais, que satisfazem 72 — 2 + q, à condição 
(3.39) resulta no seguinte: 


apelos 
=p Rap 
—-3<u<-—2. (3.40) 


FigurRA 3.20:  Bifurcação flip em ma- 
pas. (a) Lugar geométrico dos pontos fi- 
xos, (b) sua estabilidade. Os pontos fixos 
i= + v2+ qu são sempre instáveis. O ponto 
fixo trivial torna-se instável para valores de 
u<—2, pois OF /dx>1 e para valores de u>0, 
nesse caso com 9F/dr< — 1. Logo, o ponto 
fixo trivial torna-se instável com caracterís- 
ticas diferentes. (c) Representação usual da 
bifurcação flip. 


Deve ser notado que, para a faixa de valo- 
res de ju indicados em (3.40), somente existe 
o ponto fixo trivial, ou seja, não existem os 
pontos fixos reais, T = +24, tais que a 


expressão (3.40) seja atendida. Em outras 
palavras, os pontos fixos reais T = +v2 + 
são sempre instáveis, conforme ilustrado na 
Figura 3.20b. 


É interessante notar que para u = 0 o 
ponto fixo trivial (x = 0) passa por uma 
bifurcação pela qual se torna instável com 
OF/dx < —1, diferentemente do que ocorre 
para uy = —2 em que o ponto fixo se torna ins- 
tável com 0F/dx > 1. Deve-se lembrar que 
em sistemas lineares discretos, a presença de 
um autovalor real negativo resulta em um 
comportamento “chaveado” em que valores 
positivos e negativos se alternam. Por ou- 
tro lado, a presença de um autovalor real po- 
sitivo maior que um resulta em comporta- 
mento monotônico divergente. 


Tendo em vista essa observação e o fato 
de que para 4 = 0 o ponto fixo trivial apre- 
senta OF /dx < —1, deseja-se conhecer o com- 
portamento do mapa de ordem dois. Por- 


tanto, escreve-se 


Xk =F(xe, 7) 
Fx) = FF (ae, 1), pl 
Tk+1 =F[F(ge- 1) jul EE FO(xe a, (1). 


Como o mapa F é dado por (3.38), o 
mapa de ordem dois é dado por 


tn — Fu) tea + ia] 
= (Ap) ve + eia] + 
HEI) tp + tha)". 
= a PCR) dpois 
—(2+4u +32 — pê)ap + O! 
= tp +2ux-—(2+4p) 27.4 
Zk E Ip o+2uxpo—(2+44) o cos (3.41) 


em que os termos quadráticos e superiores em 
| e os termos quárticos e superiores em xp. 1 
foram desprezados, uma vez que interessa co- 
nhecer o que ocorre em torno de x = 0 e 


4 = O. Na última passagem, por conveniên- 
cia, foi usado xy (ao invés de 7,1), do lado 
esquerdo da equação (3.41) e os demais atra- 
sos foram ajustados de acordo. 


Lembrando que x, = FO(x,.o, 1), as 
condições (3.36) podem ser verificadas no 
ponto (xp-», 4) = (0,0) 


F%(0,0)=0 e 
or) 


“ag (0,0)= 1+2u-3(2+4 Wxk-s)0,0) =], 


e portanto trata-se de um ponto fixo não hi- 
perbólico. Testando-se as condições adicio- 


nais (3.37) tem-se 


(2) 
Es (0,0) = 2xp 93-42)» =0 
R (0,0) 
92 (2) 
2 ——>— (0,0) = —6(2 + 4u)xk-s ="0 
92 Ft) 
o (0,0) 
3 Fl) 
as (0,0) =—6(2+48)]  =-12%0. 


Portanto, (x,u) = (0,0) é um ponto de 
ne a tipo forquilha supercrítica para 
o mapa F, Consequentemente, para valo- 
res de u > 0, o mapa FO tem pontos fi- 
xos não triviais estáveis e um ponto fixo em 

= (0 instável. Os dois pontos fixos está- 
veis de FO, são órbitas periódicas com pe- 
ríodo 1, O1, desse mapa. Essa denominação 


indica que à cada iteração do mapa Fo 
resultado permanece inalterado, ou seja, as 
iteradas de F() em estado estacionário são 
idênticas. 


Como visto no Exemplo 2.2.3, um ponto 
fixo de um mapa F() é uma órbita periódica 
O, do mapa F. Assim, para yu > 0 o mapa 
F tem uma solução periódica que se repete 
a cada duas iteradas. Em outras palavras, 
para yu > 0, a órbita periódica estável de F é 
do tipo Os. Assim, na bifurcação em estudo, 
um ponto fixo perde estabilidade e uma ór- 
bita periódica O, ganha estabilidade. Como 
a solução do mapa F dobra de período após 
a bifurcação, a bifurcação flip é também co- 
nhecida como a bifurcação de duplicação de 
período e está ilustrada na Figura 3.20c. 


Uma importante diferença entre a bifur- 
cação flip e a forquilha é que no caso da pri- 
meira, a solução do mapa F alterna entre os 
dois braços do diagrama de bifurcação (Fi- 


gura 3.20c), ou seja, se em uma dada itera- 
ção a solução encontra-se no braço superior, 
na iteração seguinte estará no braço inferior 
(lembre-se que a órbita periódica agora é do 
tipo Os). Por outro lado, após uma bifurca- 
ção forquilha supercrítica, a solução do mapa 
está em um braço ou no outro, dependendo 
das condições iniciais. Além disso, por se 
tratar de pontos fixos todas as iteradas têm 
o mesmo valor em estado estacionário, ao in- 
vés de valores alternados, como ocorre após 
a bifurcação flip. 


A Figura3.21 ilustra o que ocorre com 
o ponto fixo estável, após a bifurcação flip. 
Em Figura 3.2la, o fato de %, ser um ponto 
fixo está claro, bem como o fato de ser es- 
tável. Aumentando-se o parâmetro de bifur- 
cação de fty, para [tg, sendo que a < fe < 
Lts, O ponto %; perde estabilidade. A análise 
feita anteriormente mostra que esse ponto 
fixo perde estabilidade porque OF /dx < —1. 


Após a bifurcação, as iteradas do mapa F al- 
ternam entre os valores % e %3, como visto 
na Figura 3.21b. Em outras palavras, após 
a bifurcação %, permanece, mas é instável, e 
aparece uma órbita formada por valores al- 
ternados de x, e «3. Tal órbita estável é do 
tipo Os (período 2) — a saída do mapa repete 
a cada duas iterações. 


3.3.5 Cascata de Bifurcações flip 


Na seção anterior considerou-se a bifurcação 
flip. Foi visto que após a bifurcação ocorrida 
para (te, que passaremos a denotar por [m, O 
ponto fixo %, perde estabilidade e surge uma 
órbita do tipo O; (referente a 1) formada por 
valores alternados de Z, e %3. Esses valores 
são pontos fixos estáveis de F, produzidos 
na bifurcação flip. 


Xk 


FIGURA 3.21: Ilustração de bifurcação flip. 
O ponto fixo 7, em (a) é assintoticamente es- 
tável e ainda não passou pela bifurcação flip, 
ou seja, fla < fe. Em (b), ug > Ke, € O 
ponto fixo %, perde a estabilidade devido à 
flip. Nessa condição valores alternados de %, 
e 3 formam uma trajetória periódica, de F, 
do tipo Os. Note que % permanece do tipo 
P,, mas após a bifurcação perde a estabili- 
dade. O gráfico (c) mostra o mapa FO. x, 


e X3 são pontos fixos estáveis do tipo O, de 
(9) 


Se a mesma análise de bifurcação fosse 
feita para cada um dos pontos fixos de FO, 
é possível verificar que cada ponto sofre uma 
nova bifurcação flip para algum novo valor 
crítico jto, do parâmetro de bifurcação. Na 
segunda bifurcação flip, x» (ponto fixo de 
Fl) perde estabilidade, dando origem a ou- 
tros dois 74 e %5, pontos fixos de F(%, que 
surgem em torno de %,. Simultaneamente, 
%3 (também ponto fixo de F()) perde esta- 
bilidade e, em torno desse ponto fixo (agora) 
instável, surgem os valores Ze e Ty, que tam- 
bém são pontos fixos de F(9. Após a se- 
gunda bifurcação flip surge a órbita estável 
Out TAS Ea Do Troco dO mapa PF, 


Portanto, Z, é um ponto fixo de F que 
perde a estabilidade quando da primeira bi- 
furcação flip, sendo que essa bifurcação ori- 
gina a órbita estável Os : ... To, X3.... Por 
sua vez, To e Z3 são pontos fixos de F2, De- 
pois da ocorrência da segunda bifurcação flip, 


X%o e %3 perdem a estabilidade e surge a ór- 
bita estável O, : ...Xa, X5, X6, X7.... Assim, 
Za, Es, To € Ty são pontos fixos de F(% (ver 
Exercício 3.14). 


Aumentando-se o valor do parâmetro de 
bifurcação, os pontos fixos estáveis sofrem bi- 
furcações flip, perdendo estabilidade por um 
lado, mas dando origem a dois novos pontos 
fixos estáveis com periodicidade duas vezes 
maior. Ássim, para um dado valor do pará- 
metro de bifurcação abaixo de um valor crí- 
tico, há uma órbita periódica estável com pe- 
ríodo 2”. Essa órbita periódica é composta 
de 2” valores que são pontos fixos estáveis 
do mapa FM. No limite, há infinitos pon- 
tos fixos, todos instáveis. Esse cenário é ve- 
rificado, em geral, para mapas unimodais — 
mapas para os quais F tem apenas um má- 
ximo. Além disso, um importante resultado 


diz que, em geral, o seguinte limite existe 


li Un — Un 
mm 
n=500 Un41— Un 


= 4,669201.... (3.42) 


À relação expressa em (3.42) é conhecida 
como a constante de Feigenbaum (Grossmann 
e Thomae, 1977; Feigenbaum, 1978). A cons- 
tante em (3.42) é universal no sentido de que 
o mesmo valor é obtido para todo mapa uni- 
modal com um máximo na forma de pará- 
bola, ou seja, o mapa no ponto de máximo 
é diferenciável. Sprott fornece os primeiros 
64 dígitos depois da vírgula para a constante 
de Feigenbaum e lista diversas referências em 
que tal constante (certamente com um nú- 
mero muito inferior de casas decimais) foi ob- 
servada em experimentos (Sprott, 2003, p. 27). 


3.3.6 Cascata Inversa 


À medida que o parâmetro de bifurcação q é 
aumentado durante uma cascata de bifurca- 


ções flip, a solução do mapa duplica de pe- 
ríodo sucessivas vezes. Incrementos cada vez 
menores são necessários para se chegar à pró- 
xima bifurcação flip. Os valores sucessivos do 
parâmetro de bifurcação convergem para um 
valor limite, chamado de ponto de acumula- 
ção. Para o mapa logístico, Sprott fornece os 


seguintes valores (Sprott, 2003, pp. 26, 27): 


ms (periodicidade 2) 

Lo = 3,449490... (periodicidade 4) 

Lt3 = 3,544090... (periodicidade 8) 

pta = 3,564407... (periodicidade 16) 

Lts = 3,5068759... (periodicidade 32) 

Le = 3,5069692... (periodicidade 64) 

tir = 3,569891... (periodicidade 128) 

Lug = 3,5969934... (periodicidade 256) 

ug = 3,5699483... (periodicidade 512) 
(periodicidade 1024) 


tro = 3,569945... 


Loo = 3,0699456718... 


sendo [too O ponto de acumulação para o mapa 
logístico. Para valores do parâmetro de bi- 
furcação pouco superiores a jo à trajetória 
do mapa é caótica, como pode ser constatado 
na Figura 3.22, apesar de não ser um regime 


caótico desenvolvido, como é o que se observa 
para valores de |y pouco menores do que 4. 


A rota para o caos para valores crescentes 
de u até atingir o ponto de acumulação [iso 
é conhecida como cascata de duplicação de 
período. Contudo, os regimes dinâmicos caó- 
ticos para u 2 lo e para yu < 4 são bastante 
distintos. O percurso que leva o primeiro re- 
gime caótico para o segundo mencionado é 
conhecido como cascata inversa de duplica- 
ção de período. 
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FIGURA 3.22: Mapa próximo ao valor de 
acumulação. Iteradas do mapa logístico 
para u=3,57. O ponto de acumulação é 
[0073,5699456718. 


A Figura 3.23 mostra esquematicamente 
como ocorre a cascata inversa de duplicação 
de período. Incialmente, para valores de | re- 
lativamente baixos, mas superiores ao ponto 
de acumulação, a trajetória caótica visita 2” 
bandas em uma determinada ordem. Na Fi 
gura 3.22 é possível constatar diversas ban- 


das estreitas, que compõem o atrator caó- 
tico. O número de bandas tende a infinito 
à medida que yu > to, OU seja, à medida 
que o parâmetro de bifurcação se aproxima 
ao ponto de acumulação. 


Na Figura 3.23 essas bandas são indica- 
das pelas letras a, b, ce d. À sequência com 
que a trajetória visita essas bandas é fixa, 
mas uma vez dentro de uma banda, a loca- 
lização da iterada é incerta. À medida que 
o parâmetro de bifurcação aumenta, as ban- 
das a e b alargam-se e fundem-se formando 
uma banda maior indicada por a. O mesmo 
ocorre com as bandas c e d, que se fundem 
para formar uma banda maior indicada por 
B. o final desse processo é possível reco- 
nhecer a parábola, característica do mapa de 
primeiro retorno do mapa logístico. 


Uma vez formadas as bandas q e 5, a 
trajetória passa a visitá-las alternadamente. 
Como anteriormente a trajetória visitava 4 


bandas (antes disso visitava 8) e agora visita 
apenas duas, pode-se dizer, com algum abuso 
de nomenclatura, que houve uma duplicação 
inversa de “período”. Deve-se notar que a tra- 
jetória não é periódica, mas sim a sequência 
de visitação das bandas. Semelhantemente, 
após as bandas a e É se fundirem para for- 
marem a banda 4, a trajetória está confinada 
a uma única banda caótica. Portanto, essa 
sequência é conhecida como cascata inversa 
e constitui-se em uma rota para o caos. 


se 2H 


FIGURA 3.23: Esquema de cascata inversa. 
Na parte inicial do diagrama a trajetória vi- 
sita alternadamente os segmentos a, b, ce d, 
não necessariamente nessa ordem. Para valo- 
res superiores de u, a trajetória visita alter- 
nadamente os setores a e 5. Para valores de 
|! maiores ainda, a trajetória está confinada 
ao segmento 4. 


3.3.7 Bifurcação 
Neimark-Sacker 


Na bifurcação de Hopf (Sec. 3.2.4) um ponto 
fixo perde estabilidade dando origem a um 
ciclo limite. Imagine um semiplano que seja 
perfurado pelo o ciclo limite em apenas uma 
direção (esse semiplano, chamado de seção 
de Poincaré, é tratado com mais detalhes no 
Capítulo 4). Nesse semiplano o ciclo limite 
é representado como um ponto fixo. Como 
tal ponto fixo é visitado uma vez a cada re- 
volução, dizemos que o mesmo é um ponto 
periódico ou um ponto fixo & de um mapa 
F:Rº> IR? associado ao semiplano defi- 
nido. Como F é bidimensional, sua matriz 
jacobiana DF (xy) € IR? (ver Eq. 2.5). Nos 
casos em que DF(x) tiver autovalores com- 
plexos conjugados, o ponto fixo % pode per- 
der a estabilidade pelo cruzamento simultá- 
neo de ambos os autovalores pela circunfe- 


rência de raio unitário. À partir desse ponto 
as iteradas começam a divergir em forma de 
espiral (lembrando que se trata de iteradas 
de um mapa). Sob a ação de não linearidade 
essas iteradas podem ficar confinadas a uma 
região finita do semiplano. 


O cruzamento da fronteira de estabilidade 
por parte de um par de autovalores com- 
plexos conjugados e a subsequente formação 
de um anel (ciclo limite) discreto é conhe- 
cida como a bifurcação de Neimark-Sacker. 
Trata-se de uma bifurcação do mapa F aná- 
loga à bifurcação de Hopf do campo veto- 
rial f. A formação de um toro T2 quando o 
campo vetorial f passa por uma bifurcação 
secundária de Hopf (veja o final da Sec. 3.2.4) 
é vista como à bifurcação de Neimark-Sacker 
do mapa F definido no semiplano mencio- 
nado. 


A bifurcação recebe o nome de J. I. Nei- 
mark e R. S. Sacker que, em 1959 e 1965, res- 


pectivamente, demonstraram sob que condi- 
ções um mapa bidimensional sofre a referida 
bifurcação. A forma normal dessa bifurcação 
é (Monteiro, 2006, p. 387): 


Br. cos0 -—sen6 | |xp-1 
[e ul] é cos 8 | fas Fá (3.43) 


2 2 cos6 —senô |ja —b|| zk-1 
+otatiê)| ão cos 0 IF a IR 


Tr =— Eles i): 


Exemplo 3.3.2 
Seja o mapa logístico com atraso 
do — (UU 1d = Cipa). (3.44) 


Esse mapa apresenta uma bifurca- 
ção Neimark-Sacker para yu = 2 (Sprott, 
2003, p. 169), ilustrado na Figura 3.24 


(ver Exercício 3.20). 


1,95 2 2,05 21 2,15 22 2,25 


FIGURA 3.24: Diagrama de bifurcação 
do mapa logístico com atraso. O ponto 
fixo não trivial do mapa em (3.44) perde 
estabilidade via bifurcação de Neimark- 
Sacker para ju = 2. 


Em diagramas de bifurcação é difícil, 
mas possível, distinguir janelas de valores 
do parâmetro de bifurcação para o qual o 


comportamento é quasiperiódico de jane- 
las com dinâmica caótica, como pode ser 
constatado comparando-se a Figura 3.25 
com a Figura 3.26. 

O anel gerado durante a bifurcação 
pode ser claramente distinguido no grá- 
fico do mapa, mostrado na Figura 3.27a. 
No regime caótico esse anel se “quebra” 
(de onde vem a expressão rota para o 
caos por quebra de toro — torus break- 
down). Essa quebra é ainda muito inci- 
piente na Figura 3.27b. A sequência com 
que as iteradas visitam o anel é diferente 
no regime quasiperiódico (Figura 3.28a) 
e caótico (Figura 3.28b). 
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FIGURA 3.25: Detalhe do diagrama de 
bifurcação do mapa (3.44). Em (a) nota- 
se a estrutra das soluções quasiperiódi- 
cas. À direita pode ser observada a ór- 
bita periódica com período 7. Em (b) são 
mostradas 50 iteradas interpoladas para 
[p= ARE 
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FIGURA 3.26: Detalhe do diagrama de 
bifurcação do mapa (3.44). No detalhe 
em (a) é possível ver cascatas de duplica- 
ção de período, que são rotas para o caos. 
À direita pode ser observado o compor- 
tamento caótico. Em (b) são mostradas 
50 iteradas interpoladas para u = 2,27. 
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FIGURA 3.27: Espaço de fase do mapa 
(3.44) 


O mapa em (a) corresponde a regime 
quasiperiódico (u = 2,17). Em (b) yu = 
2,27, o comportamento é caótico, apesar 
de não estar bem desenvolvido. A Fi 
gura 3.28 mostra com detalhe o sequenci- 
amento das primeira 14 iteradas em cada 
caso. 
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FIGURA 3.28: Detalhe do espaço de fase 
do mapa (3.44). Detalhe do sequencia- 
mento das primeira 14 iteradas para o 
mapa em (3.44) com (a) yu = 217 e, 
Mojo ta dr 


3.3.8 Intermitência em mapas 


Seja um mapa F com ponto fixo %. Nas bi- 
furcações locais descritas até aqui, o ponto 


fixo perde estabilidade graças à passagem de 
um ou mais autovalores de DF(a) pela cir- 
cunferência de raio unitário. Os diversos ce- 
nários estão ilustrados na Figura 3.29. 


A passagem de um autovalor real por 
Re(A)=1 ocorre nas bifurcações sela-nó ou 
tangente (Sec. 3.3.1), transcrítica (Sec. 3.3.2) 
e na bifurcação tipo forquilha (Sec. 3.3.3). 
Por outro lado, a passagem de um autovalor 
por Re(A)=—1 indica uma bifurcação flip ou 
de duplicação de período (Sec. 3.3.4). Essa 
bifurcação é exclusiva para mapas. (Como 
visto no Capítulo 4, os campos vetoriais po- 
dem ter ciclos (não pontos fixos) que dupli- 
cam de período. Por fim, a passagem de 
um par de autovalores complexos conjuga- 
dos pela circunferência de raio unitário, ou 
seja, |[(A;)|=1, i=1,2 caracteriza uma bifur- 
cação de Neimark-Sacker (Sec. 3.3.7), que é o 
análogo nos mapas à bifurcação de Hopf em 
sistemas de tempo contínuo. 
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FIGURA 3.29: Circunferência de raio unitá- 
rio. Os tipos de bifurcações de pontos fixos 
em mapas podem ser classificados de acordo 
com a maneira pela qual os pontos fixos per- 
dem a estabilidade. 


Como mencionado na Seção 3.3.1, pró- 
ximo à bifurcação tangente é possível que 
ocorra intermitência do tipo I. Mais preci- 
samente, esse tipo de intermitência está as- 
sociada a uma bifurcação tangente subcrí- 
tica. À intermitência do tipo III, nesse caso, 
é o resultado de bifurcações flip suberíti- 
cas (Fiedler-Ferrara e Prado, 1994, p. 159). 


Como detalhado no Capítulo 4, a bifurcação 
de Neimark-Sacker supercrítica no mapa de 
uma seção de Poincaré corresponde à forma- 
ção de um toro TZ. Uma nova bifurcação 
supercrítica levaria a uma transição entre o 
atual toro T2 e um novo toro Tê. Contudo é 
comum que, em vez de se chegar a Tê o que 
surge é um atrator estranho. Essa rota para 
o caos é via quasiperiodicidade ou por que- 
bra de toro (torus breakdown). Se em vez de 
ocorrer a bifurcação Neimark-Sacker super- 
crítica, ocorrer a subcrítica, em vez da rota 
para o caos por quasiperiodicidade o que se 
tem é intermitência do tipo II. 


Uma discussão detalhada de intermitên- 
cias e de algumas das rotas para o caos mais 
comuns pode ser encontrada em (Fiedler- 
Ferrara e Prado, 1994). 


3.3.9 Análise do mapa logístico 


Nesta subseção são ilustrados alguns dos con- 
ceitos referentes a mapas. Isso é feito usando 
o o mapa logístico (May, 1975). Em parti 
cular, deseja-se fazer o diagrama de bifurca- 
ções e analisar algumas de suas propriedades. 
O mapa logístico foi apresentado no Exem- 
plo 2.1.2 e é reescrito abaixo para maior con- 
veniência 


Ze UZe 1 ut ut (l-th 1). (3.45) 


Para valores do parâmetro uy entre le 40 
mapa (3.45) apresenta diversos regimes dinã- 
micos, inclusive o regime caótico. Esse con- 
junto de regimes dinâmicos é representado 
graficamente por meio do diagrama de bifur- 
cação, que é mostrado na Fig. 3.30. 

No Exemplo 2.2.1, foi achado que o mapa 
logístico tem dois pontos fixos, um trivial, 
Zo = 0, eum em Z = 1-—-1/u. Para os 
valores de | considerados neste exemplo (1 < 


u < 4), ZXo é sempre instável. Isso pode ser 
facilmente constatado calculando-se 


OF 
Opa 


= DF(x) = u— Zuza, 


sendo F o mapa logístico. No ponto fixo tri- 
vial tem-se DF (xo) = uu, de onde se constata 
que para u > 1 o referido ponto fixo é instá- 
vel. Semelhantemente, 


1 
Dr(m)=n=2u [1-5] =2-4, 
u 


ou seja, %, é estável para 1 < u < 3, sendo 
que para yu = 3, %, perde estabilidade ao 
sofrer uma bifurcação de duplicação de pe- 
ríodo (flip), conforme pode ser constatado 
pela Fig. 3.30. A bifurcação flip está asso- 
ciada à perda de estabilidade do ponto fixo 
pelo cruzamento de um autovalor por —1. 
Note que no presente exemplo DF(x,) = —1 
para yu = 3. À análise do que ocorre se pros- 
seguirmos aumentando |t pode ser feita como 


discutido nas seções 3.3.4 e 3.3.5. Aqui apre- 
sentamos resultados numéricos corresponden- 
tes àquelas seções para o caso do mapa logís- 
tico. 
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FIGURA 3.30: Diagrama de bifurcação do 
mapa logístico. Este diagrama é obtido pela 
iteração de (3.45) e mostrando no gráfico um 
grande (e.g. 100) número de iteradas em es- 
tado estacionário. Observa-se que para va- 
lores 1 < yu <4,o mapa (3.45) apresenta 
diversos regimes dinâmicos. 


O mapa F()=F[F(.)] para o caso do mapa 


logístico é 


cp = F(ge-1) = ep — mp 
= F[F(xp-2)] = nu (xp-2) — uP (po) 
ad Sp BD 85 
= uítu-o — (ué + uai o + 2uêm o — 
—prio (3.46) 


que, como esperado, é um polinômio de quarta 
ordem em x. Tanto F como FO estão ilus- 
trados na Figura 3.31. Para u=3 o ponto 
fixo não trivial em z;=1—1/u = 0,6667, so- 
fre uma bifurcação flip. Esse ponto fixo in- 
dicado pelo segmento de reta vertical trace- 
jado na Figura 3.31a perde estabilidade no 
ponto de bifurcação. Como F() tangencia a 
reta bissetriz nesse ponto, seus pontos fixos 
não são numericamente bem condicionados, 
mas poderíamos pensar em um ponto fixo 
não trivial com multiplicidade três. A par- 
tir de u=3, ao aumentarmos esse parâmetro, 
o ponto fixo de F (que se desloca ao longo 


da bissetriz segundo x,=1-—1/u) também é 
ponto fixo de F(2 e é instável (ver segmento 
de reta vertical pontilhado na Figura 3.31b). 
Concomitantemente, os outros dois pontos fi- 
xos não triviais de FQ, que são estáveis até 
uu = 3,44, afastam-se de do ponto fixo instá- 
vel. A perda de estabilidade do ponto fixo 
% em 4=3 e o surgimento de pontos fixos 
estáveis Zo e Z3, em torno de 7, pode ser 
claramente visto no diagrama de bifurcação 
da Figura 3.30. Nesse caso diz-se que a solu- 
ção do mapa sofre uma duplicação de período 
para u=3. 


FIGURA 3.31: Polinômios do mapa logístico. 
Polinômios F (—) e FO (—. —) do mapa 
logístico (a) para ju = 3 o ponto fixo em 7, = 
0,6667 perde estabilidade, (b) para u = 3,15 
os pontos fixos não triviais são: instável em 
Ty & 0,68254 e estáveis em To = 0,53349 e 
Xs = 0,78397. 


A partir desse momento, como discutido 
na Sec. 3.3.5, cada um dos pontos fixos es- 
táveis Z) e X or sua vez, perde estabili- 

3 , 
dade dando origem a outros dois pontos fixos. 
Chamemos de Zs e Tg OS pontos fixos estáveis 
5 C T6 
que surgem em torno de xs, e de X, e Tg, OS 


que que surgem em torno de %3. Portanto, 
para uy = 3,5 o diagrama de bifurcação da 
Figura 3.30 mostra quatro valores, que cor- 
respondem a %5, T6; Ty e Xg. Ty, Xo € Tg 
existem, mas são instáveis e, portanto, não 
aparecem no diagrama de bifurcação obtido 
por simulação. Esses oito pontos fixos (três 
instáveis e quatro estáveis), juntamente com 
o ponto fixo trivial xo (também instável) são 
pontos fixos de F(9, como pode ser consta- 
tado na Figura 3.32. Esse cenário se repete 
no que é conhecido como cascata de bifurca- 
ções flip ou cascata de duplicação de período 
até chegar ao regime dinâmico caótico. Nesse 
regime, todos os pontos fixos são instáveis. 
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FIGURA 3.32: FO) e F(Y) do mapa logístico. 
Polinômios FO (—) e F(9 (—. —) do mapa lo- 
gístico para 4=3,5. Alguns pontos fixos estão in- 
dicados por linhas verticais pontilhadas e trace- 
jadas. As pontilhadas indicam pontos fixos que 
se originaram em Zo e X3 na Figura 3.31 e que 
perdem estabilidade por meio de bifurcação flip 
em u=3,44. Nessa bifurcação, xo dá origem a 
dois pontos fixos 75=0,382, Z6=0,501 indicados 
por linha tracejadas. Também, z3 dá origem a 
dois pontos fixos 77=0,827, Xg=0,875, indicados 
por linhas tracejadas verticais. 


Para u=1 + V8 = 3,828 ocorre uma bi- 
furcação tangente por meio da qual são cria- 
dos tês pontos fixos estáveis que, por sua vez, 
sofrem sucessivas bifurcações flip. A referida 
bifurcação tangente é responsável pela janela 
de período 3 após u=3,828 (Fig. 3.37). 


3.4 Bifurcações Globais 


Até aqui foram descritas bifurcações de pon- 
tos fixos, ou pontos de equilíbrio, ou ainda 
pontos periódicos, no caso de mapas. Como 
visto, no ponto de bifurcação geralmente ocorre 
uma mudança no número e na estabilidade 
dos pontos de equilíbrio. Na presente seção 
são mencionadas algumas bifurcações não ne- 
cessariamente associada a pontos fixos. Pri- 
meiro são apresentadas bifurcações em fluxos 
e, a seguir, bifurcações em mapas. 


3.4.1  Bifurcações homoclínicas 
e heteroclínicas 


De maneira geral, uma bifurcação global 
ocorre quando variedades estável e instável 
se tocam. Casos mais específicos de bifurca- 
ções globais incluem o contato de um atrator 
com sua bacia de atração ou o de um ciclo 
limite com um ponto de equilíbrio. 


Nesta seção mencionamos brevemente al- 
gumas bifurcações globais mais comumente 
encontradas em sistemas dissipativos. À des- 
crição segue a apresentação em (Sprott, 20083, 
Sec. 7.5) e (Monteiro, 2006, Sec. 8.3). 


Um aspecto importante a lembrar neste 
estudo são as variedades estáveis e instáveis 
de pontos de sela. Para um ponto de sela, as 
variedades estável e instável servem de fron- 
teiras de grupos de trajetórias que se aproxi- 
mam e se afastam do ponto fixo em direções 
diferentes (Fig. 3.33). 


O ponto de interseção entre as variedades 
estável e instável de um (mesmo) ponto de 
sela chama-se ponto homoclínico e a trajetó- 
ria que passa por tal ponto é uma trajetória 
homoclínica. Analogamente, um ponto hete- 
roclínico corresponde à interseção da varie- 
dade estável de um ponto de equilíbrio com a 
variedade instável de um outro ponto de equi- 
líbrio e a trajetória que passa em tal ponto é 
chamada trajetória heteroclínica (ver Exercí- 
cio 3.17). 

Considere o oscilador de Duffing sem fun- 
ção forçante 


q DA = 0, (3.47) 
O oscilador em (3.47) tem três pontos fixos, 
uma sela e dois focos, cuja estabilidade de- 
pende do sinal algébrico de b (Exercício 3.16). 
A Figura 3.34 mostra trajetórias homoclíni- 
cas e heteroclínicas para esse oscilador. 


FIGURA 3.33: Pontos de sela. A parte das 
trajetórias em traço contínuo de um lado 
de uma variedade têm direções opostas às 
do outro lado. Em (a) a variedade instável 
encontra-se em negrito e em (b) a variedade 
em destaque é a estável. 
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FIGURA 3.34: Trajetórias homoclínicas e he- 
teroclínicas. Em (a) ocorre uma conexão ho- 
moclínica entre a variedade estável e instá- 
vel do ponto de sela na origem (b = 0 na 
Eq. 3.47). Em (b) ocorre uma conexão hete- 
roclínica ente a variedade estável do ponto de 
sela e as variedades instáveis dos focos (b < 0 
na Eq. 3.47). 


Um pouco antes de bifurcações glo- 
bais homoclínicas e heteroclínicas é comum 
observar-se longos transientes “caóticos”. A 
bifurcação global conhecida como homocli- 
nica faz com que as variedades estável e ins- 
tável de um ponto de sela se interceptem 
transversalmente destruindo, assim, a órbita 
homoclínica. Analogamente, o resultado de 


uma bifurcação heteroclínica é o cruzamento 
da variedade estável de um ponto de equilí- 
brio com a variedade instável de um outro 
ponto de equilíbrio. Essa bifurcação destroi 
a órbita heteroclínica existente antes da bi- 
furcação. Tais bifurcações são globais, em 
contraposição às bifurcações de ponto fixo, 
pois não podem ser previstas pela análise de 
autovalores da matriz jacobiana, que é uma 
análise local (Monteiro, 2006, p. 350). Após 
ocorrida a bifurcação, é comum que o regime 
caótico seja estabelecido como consequência 
das inteserções transversais entre as varieda- 
des estável e instável. Tais interseções são 
estruturalmente estáveis, bem como o regime 
caótico resultante. 


A razão para se ter o regime caótico após 
bifurcações homoclínicas ou heteroclínicas é 
que ao se cruzarem as variedades estável e 
instável, isso ocorre um número infinito de 
vezes. Esse resultado já era conhecido por 


Jules Henri Poincaré (1854-1912) ao final do 
Século XIX, mas ele não se atreveu a esboçar 
essa situação. O primeiro esboço é atribuído 
a George David Birkof (1884-1944) e é mos- 
trado na Figura 3.35. Monteiro esclarece que 
o teorema de Smale-Birkhoff estabelece que 
o mapa de Smale da ferradura tem dinâmica 
similar à do emaranhado homoclínico (Mon- 
teiro, 2006, pp. 362-363). 
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FiGURA 3.35: Emaranhado homoclínico. 
Quando as variedades estável W* e instável 
Wº se tocam, isso ocorre um número infinito 
de vezes. Esse evento, que destroi a órbita 
homoclínica que havia, é uma bifurcação glo- 


bal. 


3.4.2 Crises 


O tipo de bifurcação denominada crise (Gre- 
bogi et al., 1982) ocorre quando um atrator 
estranho toca uma órbita periódica ou co- 
lide com sua própria bacia de atração. Serão 
descritos três tipos de crise (Grebogi et al., 


1983a; Grebogi et al., 1987). 


Um mapa sofre uma crise de fronteira ou 
de contorno quando, sob a ação de um pará- 
metro de bifurcação, o atrator cresce até to- 
car a sua própria bacia de atração. Após a re- 
ferida bifurcação, o atrator fica ligeiramente 
maior que sua bacia de atração. Consequen- 
temente, devido à propriedade de transitivi- 
dade topológica (recorrência), depois de um 
certo número de iterações, que pode ser ele- 
vado, alguma iterada visita a região que se 
encontra fora da bacia de atração do atra- 
tor existente antes da bifurcação. A par- 
tir desse ponto, as iteradas subsequentes não 
mais permanecem na região originalmente ocu- 
pada pelo atrator, sendo levadas para uma 
nova região do espaço de estados. 


FO UH) 


tp 


FIGURA 3.36: Exemplo de crise de fronteira. 
Para yu > 4 0 atrator da equação logística 
estende-se além de seu domínio de atração, 
contido no intervalo [0 1], como mostrado em 
(a). Quando uma iterada ultrapassa a fron- 
teira, a trajetória não mais permanece sobre 
o atrator original. Em (b) está a sequên- 
cia de iteradas, sendo que aquela indicada 
pelo losango já se encontra além da fronteira. 
As três iteradas indicadas são xs, = 0,520, 
Xsg =— 1,001 e Tgg — — 0,003. 


Para o caso do mapa logístico uma crise 
de fronteira ocorre para ju = 4, pois para u > 


4 o máximo da parábola estende-se além da 
fronteira da bacia de atração, que se encon- 
tra em 1. A situação está ilustrada na Fi 
gura 3.36. 

Como pode ser notado, a crise de fron- 
teira destruiu o atrator caótico. Isso ocorre 
tão logo a condição u > 4 é verificada. Con- 
tudo, antes da trajetória visitar a parte do 
espaço que se encontra além do antigo domí- 
nio de atração, ela se mantém na região do 
antigo atrator, e ainda apresenta caracterís- 
ticas semelhantes àquelas existentes antes da 
crise. Após a crise, o escape da trajetória é 
apenas uma questão de tempo,? portanto não 
se pode falar em termos de um atrator caó- 
tico, mas sim de um transiente caótico (Gre- 


Para um valor de parâmetro | = 4 + o número 
médio de iteradas necessário para ocorrer esse es- 
cape é <T>a 7/V€. Assim, a probabilidade de que 
o transiente caótico dure 7 iterações para um con- 
junto de condições iniciais tomadas aleatoriamente é 


P(7) =e7!<7> (Sprott, 2003, pp. 176, 177). 


bogi et al., 1983b). Assim, na crise de fron- 
teira o atrator caótico torna-se uma sela caó- 
tica não atrativa, produzindo um transiente 
caótico, que pode ser bastante longo. Tais 
transientes podem ser vistos como assinatu- 
ras de que uma crise de fronteira ocorreu e 
o retorno do parâmetro de bifurcação para 
valores adequados pode restabelecer o atra- 
tor caótico. Contudo, tal atrator somente é 
observado na prática se a trajetória voltar a 
visitar a bacia de atração. 


A próxima bifurcação global a ser des- 
crita nesta seção é a crise interior. Nesse 
tipo de bifurcação um atrator caótico colide 
com uma órbita periódica instável ou com um 
ciclo limite que estejam dentro de sua bacia 
de atração. Esse tipo de bifurcação está indi- 
cado na Figura 3.37. Note que na bifurcação 
tangente, também indicada nessa figura, três 
pontos fixos estáveis foram gerados por meio 
de bifurcação sela-nó (ver Sec. 3.3.1), tam- 


bém chamada de tangente no caso de mapas. 
Como pode ser visto na Figura 3.14, na bi- 
furcação sela-nó gera-se um par de pontos 
fixos, um estável e um outro instável. Os 
três pontos fixos estáveis, gerados pela bifur- 
cação sela-nó no mapa logístico podem ser 
claramente distinguidos na Figura 3.37, um 
pouco antes de uy = 0,83. Cada um desses 
pontos fixos, por sua vez, passam por uma 
cascata de bifurcações de duplicação de pe- 
ríodo, começando por volta de u = 3,842. 


Apesar de não indicados na Figura 3.37, 
os pontos fixos instáveis, gerados na bifurca- 
ção tangente, existem dentro do domínio dos 
atratores. Por exemplo, para u = 3,835 0 
atrator é periódico com período 3. Além dos 
3 pontos periódicos que formam a órbita es- 
tável de período 3 há também 3 pontos fixos 
que formam uma órbita periódica instável de 
período 3. Tais pontos fixos foram gerados 
simultaneamente aos estáveis durante a bi- 


furcação tangente. Para ju = 3,855, 0 atrator 
é caótico e a órbita periódica instável de pe- 
ríodo 3 ainda existe, conforme ilustrado es- 
quematicamente na Figura 3.38. À medida 
que o atrator caótico aumenta de tamanho 
com o aumento de |, chega-se ao ponto em 
que tal atrator toca a órbita instável, que se 
encontra em seu domínio de atração, e que 
repele as iteradas. Imediatamente o atrator 
estranho se expande, passando a escursionar 
seu domínio de atração. A esse evento, que 
ocorre para |t = 3,8568 chama-se crise inte- 
nor. 


0 tangente crise interior 


382 383 384 385 386 387 


FIGURA 3.37: Bifurcações do mapa logístico 


Neste detalhe podem ser vistas três bifurca- 
ções ocorridas no mapa logístico: a bifur- 
cação tangente, uma cascata de bifurcações 
do tipo flip, ou seja, duplicação de período, 
sendo que a primeira é indicada na figura, e 
a crise interior. 


Logo depois da crise interior o regime di- 
nâmico foi chamado de intermitência indu- 


zida por crise (Grebogi et al., 1987). Nesse 
regime as iteradas saltam de maneira inter- 
mitente entre bandas caóticas estreitas (in- 
dicadas pelas regiões mais escuras na Fi- 
gura 3.37) e a banda caótica mais clara, ge- 
rada durante a crise. 


A última crise a ser mencionada nesta se- 
ção será a crise de fusão de atratores. Esse 
tipo de crise ocorre em sistemas com atrato- 
res (estranhos) coexistentes. Um exemplo é 
o mapa logístico antissimétrico 


Tr = utpoa(l — |xp-a]), (3.48) 


cujo mapa de primeiro retorno de (3.48) para 
4 = 4,6 é mostrado na Figura 3.39. 


tangente crise interior 


FIGURA 3.38: Crise interior. Ilustração es- 
quemática de detalhe da parte central do dia- 
grama da Figura 3.37. O ponto fixo instá- 
vel criado na bifurcação tangente é indicado 
pela linha tracejada. Quando o atrator co- 
lide com a órbita da qual tal ponto fixo faz 
parte, ocorre uma crise interior. 
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FIGURA 3.39: Mapa logístico antissimétrico. 
Mapa de primeiro retorno do atrator para 


u=4,6. 


Comparado ao mapa de primeiro retorno 
do mapa logístico, que é apenas uma pará- 
bola, percebe-se que para o mapa logístico 
antissimétrico há duas parábolas formando 
uma curva com simetria ímpar. Para u < 4, 
qualquer condição inicial tomada no inter- 

valo (0 1] resulta em uma solução confinada a 

tal intervalo. O mesmo vale para condições 


iniciais tomadas no intervalo [—-1 0). Con- 
tudo, para |u > 4 as iteradas saem de seu in- 
tervalo de origem, à semelhança do que ocor- 
ria na crise de fronteira. No presente caso, 
contudo, as iteradas, em vez de escapar para 
o infinito, encontram-se na bacia de atração 
de um novo atrator, formado para u = 4, 
que é a fusão dos atratores coexistentes para 
u<a4. 


O diagrama de bifurcação do mapa logís- 
tico antissimétrico da Eq. 3.48 mostra o mo- 
mento em que os atratores se fundem (Fi- 
gura 3.40). 


FIGURA 3.40: Bifurcações do mapa logístico 
antissimétrico. Diagrama de bifurcação. Em 
u=4 (seta) os atratores coexistentes fundem- 
se, produzido um novo atrator. 


Deve ser notado que até o ponto para o 
qual u = 4 apenas condições iniciais positivas 
foram utilizadas para gerar o diagrama de bi- 
furcação. Tivessem sido utilizadas condições 
iniciais negativas e o diagrama da Figura 3.40 
apareceria espelhado (ver Exercício 3.19). 


Leitura Recomendada 


O assunto de bifurcações de pontos fixos, 
tanto para fluxos como para mapas, re- 
cebeu tratamento detalhado em (Monteiro, 
2006; Guckenheimer e Holmes, 1983; Wig- 
gins, 1990). 

Um estudo detalhado da cascata de bifur- 
cações flip pela qual passa o mapa logístico 
pode ser encontrado em (Fiedler-Ferrara e 
Prado, 1994). Esses autores também apre- 
sentam uma análise sobre o sistema de Lo- 
renz, sendo que um estudo bastante deta- 
lhado sobre tal sistema pode ser encontrado 
em (Thompson e Stewart, 1986, Cap. 11), 
onde um capítulo inteiro é dedicado ao es- 
tudo do sistema de Lorenz. 


Os cenários de intermitência tipo I, IL e 
HI foram originalmente propostos por Po- 
meau e Manneville (1980). Uma descri- 
ção qualitativa e comparativa desses cenários 


pode ser encontrada em (Fiedler-Ferrara e 
Prado, 1994, Parte II, Cap. IV). 

A universalidade inerente à cascata de bi- 
furcações flip, ou cascata de duplicação de 
período, foi originalmente investigada por 
Michael Feigenbaum (Feigenbaum, 1978). 
Sprott menciona que Grossmann e Thomae 
encontraram o que veio a ser conhecido como 
o número de Feigenbaum um ano antes, em 
1977 (Sprott, 2003, p. 27). A generalidade do 
resultado de Feigenbaum é atestada pelo fato 
de, em pouco menos de quatro décadas, esse 
artigo ter recebido mais de 2200 citações in- 
dexadas. Uma maneira de calcular os pontos 
de bifurcação do mapa logístico foi proposta 
em (Kotsireas e Karamanos, 2004). 


Exercícios 


3.1. Considere a bifurcação sela-nó ilus- 
trada na Figura 3.14b. Por meio de simula- 


ções comprove o sentido das setas nessa fi- 
gura. Como indicaria as setas para u > 1? 
Use simulações e análise para descrever o que 
acontece nessa situação. 


3.2. Mostre que o diagrama de bifurcação 
da forma normal (3.5) é o mostrado na Fi- 
gura 3.4b. 


3.3. Considere a família de campos veto- 
riais de primeira ordem e de um parâmetro 
f(x, vu). Seja (x, u) = (0,0) um ponto fixo 
hiperbólico dessa família de campos vetori- 
ais. Expandindo f(x, |) em série de Taylor 
em torno de (x, u) = (0,0), chega-se a 


f(x, )=autax+azur+razu"+0(3) (3.49) 


em que O(3) representam os termos de or- 
dem três e superior. Qual é a condição para 
que f(s, |) sofra uma bifurcação sela-nó em 


(x, 4) = (0,0). Compare sua resposta com 
a forma normal (3.5). O que pode ser con- 
cluído? 


3.4. Mostre que o diagrama de bifurcação da 
forma normal à = ax? é igual ao mostrado 
na Figura 3.5b. 


3.5. Esboce o diagrama de bifurcação da 
forma normal à = ua + 3. Como você deno- 
minaria a bifurcação sofrida por esse sistema 
para je = 0? 


3.6. Considere uma versão perturbada da 
equação normal da bifurcação forquilha: x = 
ô+ ua — x2. Discuta como ó afeta a locali- 
zação de pontos fixos, mesmo para valores 
pequenos. Use simulações com 0=10"º para 
esboçar o diagrama de bifurcação resultante. 
Comente. 


3.7. Analise analiticamente e por simula- 
ção a estabilidade do ponto fixo, no ponto de 
bifurcação u = O para as bifurcações super- 
críticas sela-nó, transcrítica, forquilha e de 
Hopf. 


3.8. Discuta como obteria as formas nor- 
mais das bifurcações de pontos fixos de ma- 
pas sela-nó, transcrítica e forquilha, a partir 
das respectivas formas normais para fluxos. 
Dica: considere um procedimento de discre- 
tização simples. 

3.9. Considere a bifurcação transcrítica ilus- 
trada na Figura 3.18b. Por meio de simula- 
ções comprove o sentido das setas nessa fi- 
gura. Como indicaria as setas para —2 > u 
e para ju > 2? Use simulações e análise para 
descrever o que acontece nessas situações. 


3.10. Considere a bifurcação forquilha ilus- 
trada na Figura 3.19b. Por meio de simula- 
ções comprove o sentido das setas nessa fi- 
gura. Como indicaria as setas para —2 > u 


e para ju > 1? Use simulações e análise para 
descrever o que acontece nessas situações. 


3.11. As formas normais das bifurcações 
subcríticas do tipo sela-nó, transcrítica e for- 
quilha são, respectivamente, 


2 
Tp = tr tu+tis 
2 
Tk => Tek 1 TUTEIT TE 
3 
Tk => Th TULE TT 


Esboce os diagramas de bifurcação para cada 
um desses casos. 


3.12. As formas normais são estrutural- 
mente estáveis no sentido de que o acréscimo 
de termos de mais alta ordem não afeta o 
resultado. Argumente em favor (ou em con- 
tra) dessa afirmação utilizando, por exemplo, 
a forma normal da bifurcação sela-nó para 
mapas (ver Eq. 3.27). 


3.13. Verifique que as condições (3.37) são 
satisfeitas pela forma normal (3.33). 


3.14. Na Seção 3.3.5 foi descrita a cascata 
de bifurcações flip. Foi argumentado que a 
sequência ...Z4, Ts, X6, X7... é uma órbita 
O, de um mapa F e que, portanto, Ty, Xs5, 
Xe € X, são pontos periódicos de F(9. Como 
classificaria as sequências ...X4, T6, Tu, Xe... 
e ssss Xr, 5, T7...? 


3.15. Determine o limite expresso em (3.42) 
para o mapa logístico e para o mapa de Hé- 
non (2.6). No caso do mapa de Hénon, use 
0,3 <a < 1,4 como parâmetro de bifurcação. 
Compare os valores encontrados. 


3.16. Determine a localização dos pontos 
fixos de (3.47) e classifique-os quanto a esta- 
bilidade nos seguintes casos b < 0,b =0e 
b>0. 


3.17. Comente a frase: as trajetórias homo- 
clínicas e heteroclínicas são de duração infi- 
nita. 


3.18. Por simulação, tente verificar que o 
mapa de Hénon (2.6) sofre uma crise de fron- 
teira para a = 1,08 (Grebogi et al., 19834). 


3.19. Faça o diagrama de bifurcação do 
mapa logístico antissimétrico da Eq.3.48, 
(a) começando com condições iniciais nega- 
tivas tomadas no intervalo [—-1 0); (b) co- 
meçando com condições iniciais tomadas ale- 
atoriamente no intervalo |-1 1]. Gere o 
mapa de primeiro retorno para ju = 3,95 para 
xo = 0,55 e para xo = —0,55. Refaça tal 
mapa para |t = 4,05. Usando as figuras ge- 
radas, explique o que ocorreu em ju = 4. 


3.20. Mostre evidências de que o 
ponto fixo não-trivial do mapa logístico com 
atraso (3.44) perde estabilidade por uma bi- 
furcação de Neimark-Sacker para ju = 2. 


Capítulo 4 


Bifurcações de 
Ciclos, 
Amostragem de 
Poincaré e 
Atratores 
Estranhos 


O Capítulo 3 apresentou algumas bifurca- 
ções de pontos fixos, tanto para fluxos como 
para mapas. Ássim como pontos fixos po- 
dem passar por bifurcações, os ciclos tam- 
bém. Este capítulo apresenta algumas bifur- 
cações de ciclos. O importante conceito de 
amostragem de Poincaré também é apresen- 
tado neste capítulo. Mostra-se que tal pro- 
cedimento serve, em alguns casos, como elo 
de ligação entre as bifurcações de ciclos e a 
de pontos fixos de mapas. Por fim o capí- 
tulo encerra mencionando atratores caóticos 
e algumas de suas características. 


4.1 Bifurcações de Ciclos 


No caso de pontos fixos, bifurcações estão as- 
sociadas à criação ou à extinção de pontos 
fixos ou à mudança de estabilidade. Em li- 
nhas gerais isso permanece verdadeiro para 
os ciclos. O número de bifurcações de ciclos 


abordado é menor que o de pontos fixos. 


Para começar consideremos a Figura 4.1. 
Iniciamos com um ponto fixo estável do tipo 
foco (Fig. 4.1a). Esse ponto fixo pode perder 
estabilidade ao mesmo tempo que surge um 
ciclo limite estável com período um via uma 
bifurcação de Hopf (Fig. 4.1b), como descrito 
na Seção 3.2.4. Imaginemos agora que o ciclo 
limite, que surgiu de uma bifurcação de Hopf 
supercrítica, perca estabilidade e, ao mesmo 
tempo, um outro ciclo, mas com período dois, 
seja criado. O sistema é repelido do ciclo li- 
mite instável de período um e é atraído para 
o ciclo estável de período dois (Fig. 4.1c). É 
importante observar que apesar de a bifur- 
cação de Hopf (entre Fig.4.la e 4.1b) ser 
possível em duas dimensões (lembre-se que 
a forma normal da bifurcação de Hopf é de 
segunda ordem), a duplicação de período de 
ciclo (entre Fig. 4.1b e 4.1c) requer ao me- 
nos um espaço de estados de dimensão três, 


pois uma órbita periódica de período dois ou 
superior não pode ser representada em um 
espaço de dimensão menor, sem incorrer na 
auto-intersecção de trajetórias, o que não é 
permitido pelo teorema da unicidade. 


A O 


FIGURA 4.1: Bifurcação de ciclo. (a) Ponto 
fixo estável do tipo foco (b) perda de estabilidade 
do ponto fixo e surgimento de um ciclo limite es- 
tável de período um, (c) perda de estabilidade 
do ciclo limite original e surgimento de outro ci- 
clo limite estável, que tem o dobro do período, 


(d) detalhe de (c). 


Uma órbita de período um repete-se 
a cada revolução no espaço de estados 
(Fig. 4.1b). De modo análogo, uma órbita 
de período dois repete-se a cada duas revo- 
luções no espaço de estados, como ilustrado 
na Figura 4.1c. A mesma terminologia é uti- 
lizada para órbitas de periodicidade superior. 
Por exemplo, é possível que a órbita de pe- 
ríodo dois perca a estabilidade, dando ori- 
gem a uma nova órbita com o dobro da pe- 
riodicidade, ou seja, uma órbita que se re- 
pete a cada quatro revoluções pelo espaço 
de estado. Esse cenário corresponde a uma 
cascata de duplicação de período de ciclos, 
análoga à cascata de duplicação de período 
de pontos periódicos (pontos fixos do mapa 
Fl) p= 2,3,...), como aquele visto na Sub- 
seção 3.3.9 para o mapa logístico. 


É útil traçar um diagrama de bifurca- 
ção de ciclos com, por exemplo, uma cas- 
cata de duplicação de período. Contudo seu 


traçado não pode ser feito como no caso da 
duplicação de pontos periódicos de mapas. 
O traçado do diagrama de bifurcação de ci- 
clos é grandemente facilitado por um pro- 
cedimento conhecido como amostragem de 
Poincaré, apresentado na Seção 4.2. Antes, 
porém, ilustramos a bifurcação de ciclos por 
meio de um exemplo. 


Exemplo 4.1.1 


A equação do oscilador de Duffing-Ueda 
é dado por (Duffing, 1918; Ueda, 1985; 
Ueda, 2001): 


t+kz + = u(b), (4.1) 


em que k é uma constante e u(t) é uma 
função forçante. Neste exemplo são usa- 
dos os valores k=0,1 e u(t)=A coswt, com 
w=l rad/s. A fim de simular esse oscila- 


dor, usamos um intervalo de integração 
pequeno e igual a ót=27/(500w). A ra- 
zão de escolher o intervalo de integração 
dessa forma é garantir que haja um nú- 
mero inteiro de intervalos de integração 
por período da função forçante. Como 
visto mais adiante neste capítulo, esse é 
um cuidado importante de se tomar. À 
escolha de 500 intervalos por período é 
reconhecidamente conservadora. 

Escolhendo a função  forçante 
como u(t)=4,0cost e condição inicial 
g=[0,01 0,01]”, o estado estacionário da 
Eq. 4.1 está mostrado na Figura 4.2. 

O regime dinâmico do oscilador para 
essa função forçante é uma órbita perió- 
dica de período um, ou seja, para cada 
período de u(t) (iguala T = 27/w = 27) 
o sistema completa uma revolução no es- 
paço de estado e se repete, como visto 
na Figura 4.2a. No plano de fase, Fi- 


gura 4.2b, isso pode ser constatado, por 
exemplo, traçando uma semirreta verti- 
cal para cima ou para baixo a partir do 
ponto fixo triplo que existe na origem 
(verifique esse resultado). Note como a 
trajetória intercepta essa semirreta em 
apenas um ponto. 

Semelhantemente, tomando 
u(t)=5,2cost a solução no tempo e 
a sua representação no plano de fases 
é mostrada na Figura 4.3. Procedendo 
como anteriormente (no plano de fases), 
é possível concluir que a dinâmica em 
estado estacionário (o conjunto limite 
w) é periódico, com período 2. Essa 
informação pode também ser obtida a 
partir da série temporal de a(t) (ver 
Exercício 4.2). 


FIGURA 4.2: Órbita período um. Órbita 
de período um do oscilador Duffing-Ueda 
(Eq. 4.1) para k=0,1 e u(t)=4cost. (a) Sé- 
rie temporal, (b) plano de fase (xi (t)=x(t) 
e xa()=a(t)). 


Para u(t)=6,0cost o oscilador de 
Duffing-Ueda com os parâmetros usados 
tem uma solução assintótica periódica de 
período 3, como mostrado na Figura 4.4. 
Da teoria, sabemos que a saída um sis- 


tema linear excitado a uma frequência 
w, em estado estacionário só tem po- 
tência espectral nessa frequência. Além 
dos harmônicos da frequência fundamen- 
tal w = lrad/s, presente na saída para 
os três valores de A usados, para 4=5,2 
aparece também uma sub-harmônica em 
w/2e para A=6 há potência espectral na 
sub-harmônica w/3, que são reflexos do 
período 2 e período 3, respectivamente. 
O aparecimento de frequências harmôni- 
cas e sub-harmônicas é devido à não li- 
nearidade. 


-3 -2 — x” 1 2 
FIGURA 4.3: Órbita de período dois do os- 
cilador Duffing-Ueda (Eq. 4.1) para k=0,1 e 
u(t)=5,2 cost. (a) Série temporal, (b) plano 
de fase (xi(t)=x(t) e va(t)=á(t)). 


O presente exemplo também ilustra o 
fato de que entre a condição definida pela 
entrada u(t)=4,0cost e u(t)=5,2cost a 
solução periódica de período 1 perde es- 
tabilidade, dando origem a uma solução 
periódica de período 2. Compare os grá- 


ficos na Figura 4.2 com os corresponden- 
tes mostrados na Figura 4.3 e observe 
como a solução período 2 efetivamente 
está próxima da solução de período 1 (ver 
Exercício 4.3). Contrariamente a isso, a 
solução de período 3 não está próxima 
das outras duas. À razão para isso é que 
ao passo que a solução de período 2 sur- 
giu por uma bifurcação de duplicação de 
período (de ciclo), a solução de período 3 
surge de outra forma. 


FIGURA 4.4: Órbita de período três do os- 
cilador Duffing-Ueda (Eq. 4.1) para k=0,1 e 
u(t)=6 cost. (a) Série temporal, (b) plano 
de fase (xi(t)=x(t) e rs(t)=á(t)). 


4.2 Amostragem 
de Poincaré 


O sistema solar é estável? Essa pergunta 
foi tema de um desafio promovido pelo rei 


da Suécia ao fim do século XIX. Ao procu- 
rar respondê-la, o matemático francês Henri 
Poincaré (1854-1912) concebeu o seguinte pro- 
cedimento. Primeiro, imaginou um semiplano 
que se estendia da Terra até o espaço. Se a 
intersecção da trajetória da Lua com esse se- 
miplano ao longo de várias órbitas lunares 
ocorresse sempre no mesmo ponto, a órbita 
da Lua seria periódica e estável. Se o ponto 
de cruzamento estivesse cada vez mais perto 
da Terra, a Lua, cedo ou tarde, colidiria com 
este planeta. Se o contrário fosse verdadeiro, 
a Lua estaria afastando-se da Terra. 


Com esse engenhoso dispositivo Poincaré 
não foi capaz de responder à referida per- 
gunta, pois o problema é de maior comple- 
xidade daquele definido por apenas dois cor- 
pos (Terra e Lua). Contudo, o procedimento 
concebido, que é conhecido por amostragem 
de Poincaré, mostrou ser de grande utilidade 
em problemas práticos e teóricos, como visto 


ao longo deste capítulo e em vários outros 
pontos deste livro. 


A seção de Poincaré para um campo ve- 
torial f : IR” +» IR” é uma hipersuperfície 
de dimensão IR”! que nao seja tangente ao 
campo vetorial — ou seja, as trajetórias de- 
vem atravessar à seção — e que seja perfurado 
pelas trajetórias em uma única direção. 


Considere a Figura 4.5 em que é mos- 
trada uma trajetória ó(axo,t) no espaço de 
estados de dimensão 2. Dentre as semirretas 
Pe lR,i = 1,2,3 a única que serve como 
seção de Poincaré é P,, pois, apesar de todas 
terem a dimensão correta (n — 1), P» é per- 
furada pela trajetória nas duas direções, ou 
seja, na parte inferior é perfurada da direita 
para a esquerda, e na parte superior ocorre o 
contrário. A semirreta Ps, por sua vez, tan- 
gencia o campo vetorial em um determinado 
ponto e, portanto, não é atravessada pela tra- 
jetória em toda revolução pelo espaço. 


Consideremos agora os pontos em que a 
trajetória G(xo, t) intercepta a seção de Poin- 
caré. Para isso podemos pensar nos instan- 
tes de tempo t;ld(xo,t) NP, £ À. Por 
simplicidade chamemos esses instantes de ta, 
to; te etc. O primeiro ponto da trajetória é 
G(ãxo, ta), o segundo é G(xo, ty), e assim suces- 
sivamente. Por serem pontos da trajetória, 
em IR2, também são vetores bidimensionais, 
pois são os valores do vetor de estado nos 
instantes ta, tp, te etc. Para definir os pontos 
correspondentes sobre a seção P,, podemos 
tomar qualquer um dos elementos do vetor de 
estado x. Supondo que x = [x y|”, tomamos 
o primeiro elemento na presente discussão. 
Assim chamamos xp = (ta), Lui = v(to), 
Tso = U(te), Xps3 = (ta) e assim sucessiva- 
mente. 


No caso ilustrado na Figura 4.5, a tra- 
Jetória converge assintoticamente para o ci- 
clo limite y, que é o conjunto limite w. Se- 


melhantemente, a sequência xp, Lp41 ... con- 
verge assintoticamente para X, que é o ponto 
no qual a trajetória intercepta P, em t > 
oo. Como agora tem-se uma sequência dis- 
creta de valores Xp, Xky1-.., é razoável ima- 
ginar que exista um mapa F tal que, xp = 
F(xx), k = 0,1,... Nesse caso, note que Z, 
que é o valor limite da sequência de iteradas 
do mapa, é ponto fixo de F. 


Antes de considerarmos questões mais ge- 
rais desse procedimento, devemos mencionar 
um par de aspectos práticos. O primeiro 
diz respeito à escolha da seção de Poincaré. 
Mesmo no exemplo simples ilustrado na Fi- 
gura 4.5, é possível ver que existem infinitas 
maneiras de escolher seções de Poincaré que 
atendam aos requisitos mencionados. Em 
princípio, a análise realizada usando qual- 
quer seção de Poincaré válida resulta nas mes- 
mas conclusões. Contudo, na prática, algu- 
mas escolhas podem ser mais fáceis de inter- 


pretar que outras. Semelhantemente, a es- 
colha de que elemento do vetor de estado «x 
usar pode ter influência numérica, mas não 
conceitual. 


Th+3 


FIGURA 4.5: Seção de Poincaré unidimensio- 
nal. A única seção de Poincaré válida é P, E IR. 
A trajetória d(xo,t) atravessa P, E IR sequen- 
cialmente em x, Lk+1 etc, até convergir assin- 
toticamente para %, sobre o ciclo limite y, que é 
o conjunto limite w de d(xo, t). 


A amostragem de Poincaré permite que 
um sistema de ordem n seja analisado em 


um subespaço (a seção de Poincaré) de or- 
dem n — 1. Além disso, esse procedimento 
permite que um campo vetorial f seja anali- 
sado por meio de um mapa F, ou ainda, que 
as características de uma trajetória d(xo, t) 
sejam investigadas a partir de uma sequên- 
cia de iteradas x. Se a seção de Poincaré 
tiver sido corretamente definida, a análise no 
âmbito dessa seção é equivalente àquela re- 
alizada no espaço original. Por exemplo, na 
Figura 4.5 vemos que o conjunto limite w de 
ó(xo, t) é o ciclo limite estável y. Semelhan- 
temente, o conjunto limite w da sequência de 
iteradas xy é o ponto fixo estável % do mapa 
F. Dessa maneira, usando amostragem de 
Poincaré é possível fazer a análise de estabi- 
lidade de ciclos limite a partir da estabilidade 
dos pontos fixos do mapa F. Para realizar a 
análise de maneira “teórica” é necessário ob- 
ter F a partir da sequência de iteradas x», 
o que, em princípio, pode ser feito numeri- 


camente. Ao longo deste livro, via de regra, 
a análise de F é geométrica, o que dispensa 
uma expressão matemática para esse mapa. 


4.2.1 Equivalência entre 
fluxos e mapas 


No caso ilustrado na Figura 4.5, um ciclo li- 
mite (qualquer que seja sua estabilidade) cor- 
responde a um ponto fixo na seção de Poin- 
caré (com a mesma estabilidade do ciclo). É 
natural que indaguemos a respeito da apa- 
rência de outros conjuntos assintóticos sobre 
a seção de Poincaré. Antes, contudo, vere- 
mos como representar campos vetoriais bidi- 
mensionais e a partir daí as mesmas ideias 
são estendidas para campos tridimensionais. 


Exemplo 4.2.1 


No Exemplo 1.1.3 foi visto que o espaço 
de estados do do oscilador harmônico 
amortecido, que é bidimensional, pode 
ser representado no plano (x,%) € IR?, 
como ilustrado na Figura 1.4. No Exem- 
plo 1.1.4, o espaço de estados do pêndulo 
simples, que também é bidimensional, foi 
representado sobre a superfície do cilin- 
dro (0, 1h) E $ x IR, como mostrado na 
Figura 1.6. 

Ainda há uma terceira representa- 
ção de um campo vetorial bidimensio- 
nal, que é útil. Considere dois osciladores 
harmônicos, como o analisado no Exem- 
plo 1.1.1, mas sem amortecimento: 


E+uwr=0 


j+wiy=o0, 


que podem ser reescritos como 


Lj = 12 

es (4.2) 
Yi = Ya 

yo = —wiy, 


sendo o espaço de estados conjunto: 
(x1,X2,y1,)2) E IRÉ. As soluções para 
cada oscilador são oscilações senoidais 
sem amortecimento, ou seja, são órbi- 
tas fechadas unidimensionais em IR? 
Usando a transformação de variáveis 
(Wiggins, 1990, p. 34): 


71 = VJo/wo sendo, x2 = VIowo cos 0 
ww = Vh/w send, yo = vhwcoshb,, 


em que 1 e 1, são constantes, a dinâmica 


do campo vetorial em (4.2) é descrita por: 


( do = oo (4.3) 


01 = Ui, 


uma vez que ) = 0€e 1, = 0. O espaço de 
(4.3), que corresponde à variedade sobre 
a qual estão as soluções de (4.2) em es- 
tado estacionário, é a conjunção de dois 
espaços cilíndricos. Portanto, tem-se que 
(00,01) E 8x8 = T2, ou seja, trata-se de 
um toro T2. Tanto 8x IR como T? são lo- 
calmente homeomórficos ao plano IRZ. O 
espaço T?2 é particularmente conveniente 
quando há duas frequências importantes 
nas trajetórias do sistema, como visto no 
Exemplo 4.2.2, a seguir. 


Exemplo 4.2.2 


Neste exemplo, consideramos um oscila- 
dor harmônico forçado, em que a função 
forçante é senoidal. Usamos como ponto 
de partida o campo vetorial (4.2), que é 
reescrito abaixo com um termo adicional 
na segunda equação: 


v=y 

SR O 

“o Wjx + 2 (4.4) 
1 = 22 

IE o 


As duas últimas equações, que corres- 
pondem a um subsistema em IR? desa- 
coplado do oscilador descrito pelas duas 
primeiras equações (o contrário não é ver- 
dadeiro) têm por solução uma oscilação 
senoidal do tipo: 2 = Acoswt, em que A 
depende das condições iniciais desse sub- 


sistema. Portanto, o sistema (4.4) é co- 
mumente descrito como (Wiggins, 1990, 
p.71) 


T=y 
y = —wça + AcosB (4.5) 
— 


em que O E [0, 27) e cujo espaço de 
estados é (7,y,0) E IR? x S. Esse es- 
paço é tridimensional e corresponde a um 
semiplano que gira sobre um eixo. No 
caso deste exemplo, tem-se o oscilador 
harmônico com estado (x,y) E IR? com 
frequência de oscilação wo. Imagine um 
ciclo fechado sobre esse plano, sendo que 
o estado do oscilador autônomo percorre 
tal órbita com frequência wo. Além disso 
tem-se a função forçante, que impõe ou- 
tra frequência w. É como se a função 
forçante fizesse o plano (x,y) € IR? gi- 
rar, agora no espaço 3D, com frequência 


constante w. Para esse sistema é possível 
definir a seção transversal: 


P=((2,y,0)€CR?x8|0=0/€IR?(4.6) 


que pode ser interpretada como uma se- 
ção de Poincaré específica. Nesse caso 
a amostragem de Poincaré corresponde 
a uma amostragem estroboscópica com 
frequência w. Portanto, toda vez que a 
função forçante passar por uma determi- 
nada fase, no caso de (4.6) essa fase é 
6 = 0, toma-se o valor do par (x,y). As- 
sim, pode-se ver que P é bidimensional, 
uma vez que na amostragem reduziu-se 
uma dimensão. Neste caso, o mapa de 
Poincaré é da forma P: Ps P, cu- 
jos detalhes podem ser encontrados em 
(Wiggins, 1990, p. 72). 

Para concluir este exemplo, analise- 


mos a geometria da solução de (4.5). Para 
isso começamos considerando a solução 
sem o termo Acos6. Como vimos trata- 
se de um ciclo fechado. O efeito de A cos 0 
é fazer esse ciclo girar, formando uma fi- 
gura toroidal, chamada toro T2. Note 
que a solução fica sobre a superfície do 
toro, que é localmente difeomórfica ao es- 
paço euclideano IR2. A Figura 4.6 ilustra 
os principais conceitos deste exemplo. 


y 
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FIGURA 4.6: A solução de (4.5) pode ser re- 
presentada no toro T2, mostrado em (a). Em 


(b) mostra-se a seção de Poincaré P. As frequên- 
cias associadas w9 € w são, respectivamente, as 
do oscilador harmônico não forçado e a da fun- 
ção forçante. 


No Exemplo 4.2.2 foi visto como um fluxo 
pode ser “reduzido” a um mapa por meio de 
uma amostragem espacial: a amostragem de 
Poincaré. O mapa correspondente tem uma 
dimensão menor do que a do fluxo, mas se a 
seção utilizada na amostragem for uma seção 
de Poincaré, o mapa incorpora as principais 
características do fluxo. Portanto, análises 
feitas usando o mapa devem corresponder às 
respectivas realizadas para o fluxo que, sendo 


de dimensão superior, são normalmente mais 
difíceis de realizar. 


A correspondência entre o fluxo e o mapa 
de Poincaré também se aplica a trajetórias 
(soluções do fluxo) no espaço de estados e a 
sequências de iteradas (soluções do mapa) na 
seção de Poincaré P. Em particular, consi- 
dere uma órbita de período um no espaço de 
estados, que pode ser o conjunto limite w do 
campo vetorial para uma determinada con- 
dição inicial. Essa trajetória perfura a seção 
de Poincaré uma vez por revolução. Lembre- 
se que, por definição, a seção de Poincaré só 
pode ser traspassada em uma única direção 
pelo fluxo. 


A Figura 4.7a mostra que o conjunto li- 
mite w do mapa correspondente P:P 5 P 
é um ponto fixo desse mapa. Se a órbita do 
campo vetorial for estável, o ponto fixo do 
mapa também é. Semelhantemente, uma ór- 
bita de período dois no campo vetorial, apa- 


rece como dois pontos sobre P, como ilus- 
trado na Figura 4.7b. Nesse caso, os pontos 
não são pontos fixos de P, uma vez que eles 
se alternam, mas como visto na Seção 3.3.4, 
ambos são pontos fixos de PO), 


(a) (b) 
P P 


FIGURA 4.7: Amostragem de Poincaré para 
dois ciclos. (a) Um ciclo de período 1 se reduz 
a um ponto fixo do mapa P:P +» Pe (b) um 
ciclo de período 2 aparece como dois pontos (não 
pontos fixos!) do mapa P:P 5 P. 


Diz-se que uma órbita periódica que se 
repete a cada N revoluções no espaço é pe- 
riódica com período N. Note que N não 
indica a duração temporal do período, mas 
sua extensão medida em termos de número 


de revoluções no espaço. Portanto a órbita 
na Figura 4.7a é de período 1 e a mostrada 
na Figura 4.7b é de período 2. O resultado 
implícito na Figura 4.7 pode ser generalizado 
como segue. Uma órbita de período N cor- 
responde a uma seção de Poincaré com N 
pontos. 


No caso do oscilador harmônico forçado 
discutido no Exemplo 4.2.2 há duas frequên- 
cias: a frequência natural do oscilador wo e 
a da função forçante: w. É esta que deter- 
mina as revoluções ao longo do espaço. Isso 
fica imediatamente claro representando o os- 
cilador no espaço IR? x $, como ilustrado na 
Figura 4.6. A duração temporal do período 
da função forçante é T = 27/w e a do osci- 
lador é To = 27/wo. Se NT = my, m EN, 
então para cada N revoluções no espaço, ou 
seja, a cada N períodos da função forçante, 
o estado do oscilador se repete m vezes. Por 
exemplo, se N = 1, tem-se uma solução do 


tipo período 1. 


Contudo, no caso de osciladores não line- 
ares não existe essa restrição, e a saída pode 
ter um período diferente do período da fun- 
ção forçante. Por exemplo, se (x,y) E IR? se 
repetir um número m ímpar de vezes ao longo 
de duas revoluções no espaço, dizemos que a 
solução é de período 2, pois 27 = mTy. No 
caso geral tem-se que se NT = mT a saída 
é de período N se N em não tiverem fatores 
em comum. Por exemplo, se N =4em=2 
a solução é de período 2, mas se N = 4 e 
m = 3, a solução é de período 4. 


Caso a razão To/T = w/wo não seja ra- 
cional, como classificar a solução do campo 
vetorial? E nesse caso, o que se espera en- 
contrar na seção de Poincaré P? Se w/wo 
não for racional, a solução do fluxo não é 
periódica e o número de pontos sobre P é 
infinito. A interação de wo com w e o fato 
de que a razão entre as duas não é racional 


faz com que a trajetória evolva sobre o toro 
Tº gradativamente recobrindo toda a sua su- 
perfície. Portanto, o que se vê em P é um 
caminho fechado. Esse regime dinâmico é co- 
nhecido como quasi periódico (note que não 
é “quase”). Esse é o caso, por exemplo se 
wo = Trad/sew = 4rad/s. 

Ainda há um outro regime dinâmico de 
grande interesse associado a esse cenário. Tal 
regime se verifica quando a solução do oscila- 
dor não é periódica e, portanto, não faz sen- 
tido falar em termos de Ty e a trajetória não 
evolui sobre um toro. Um exemplo é o re- 
gime caótico em osciladores não lineares. O 
próximo exemplo mostra um caso assim e o 
que se encontra na seção de Poincaré é uma 
figura fractal. Essa é a geometria associada 
ao regime dinâmico caótico. 


Exemplo 4.2.3 


Utilizando o Exemplo 4.2.2, o oscilador 
de Duffing-Ueda em (4.1) pode ser repre- 
sentado no espaço de estados (7,y,0) E 
IR? x $ como: 


E 
US ético zº + Acos6 (4.7) 
P=w, 


em que k é uma constante e a função for- 
cante é u(t) = Acoswt. Assim como feito 
no Exemplo 4.2.2, pode-se definir uma 
seção de Poincaré para uma determinada 
fase da função forçante. A Figura 4.8 
mostra um atrator caótico (4,k,w) = 
(11,0,1,1,0), a seção de Poincaré com a 
representação do corte do atrator nessa 
seção. À imagem formada sobre a seção 
de Poincaré é fractal, indicando, em ge- 


ral, dinâmica caótica. O aparecimento de 
objetos fractais que não correspondem a 
dinâmica caótica é raro, como discutido 
posteriormente. 


EU) 


v(t) 


FIGURA 4.8: Seção de Poincaré. A seção 
de Poincaré (y,1) E IR? — correspondente a 
(x, 1) em (4.7) — tem uma dimensão a menos 
que a do espaço de estados do sistema. No 
caso de dinâmica caótica, a imagem na seção 
de Poincaré é um fractal. Fonte: (Aguirre, 
1994a). 


Exemplo 4.2.4 


O objetivo deste exemplo é alertar para 
uma diferença conceitual que existe entre 
mapas e modelos discretos de um campo 
vetorial contínuo. 

Um sistema contínuo g= f(x, u) pode 
ser analisado em uma seção de Poincaré 
P, como discutido ao longo desta seção. 
Observando-se as consecutivas iteradas 
sobre P é possível, ao menos em prin- 
cípio, obter um mapa P: Ps P, cha- 
mado de mapa de Poincaré. Esse mapa 
deve ser capaz de determinar o próximo 
valor sobre a seção P, a partir da ante- 
rior. 

Uma situação que apesar de diferente 
causa confusão corresponde a tomar ver- 


sões em tempo discreto dos sinais relacio- 
nados ao sistema contínuo e a partir des- 
ses sinais encontrar a versão discretizada 
desse sistema. Alternativamente, pode- 
se aplicar algum algoritmo de discretiza- 
ção às equações do campo vetorial para 
obter a sua versão discretizada. Apesar 
de o modelo resultante também ser dis- 
creto, ele é uma aproximação do fluxo e 
não do mapa P:P+5 P. Uma aproxi- 
mação desse mapa poderia ser obtida nu- 
mericamente, em princípio, procurando 
ajustar um modelo em tempo discreto 
à sequência de iteradas que aparece so- 


bre P. 


Por exemplo, amostrando-se x(t) 
e ult) do oscilador de Duffing-Ueda 
em (4.1) com período de amostragem 
T.=7/60, de modo a se ter 120 amostras 
por período da entrada u(t)=11 cost, 
pode-se obter o modelo (Aguirre e Bil- 


lings, 1994): 


y(k) = 2,1579y(k — 1) — 1,3203y(k — 2) + 0,16239y(k — 3) 
+0,22480 x 107 2y(k — 3)? — 0,48196 x 107 2y(k — 1)º 
+0,19463 x 107 2u(k — 2) + 0,34160 x 10 2u(k — 1) 
+0,35230 x 107 2y(k — 1)2y(k — 2) 

—0,12162 x 102y(k — Dy(k — 2)y(k — 3), (4.8) 


em que se usou o símbolo y(k) para re- 
presentar a versão amostrada de x(t), ou 
seja, y(k)=x(kT.) e u(k)=1I coskT;. A 
seção de Poincaré para o modelo (4.8) foi 
obtida por amostragem estroboscópica e 
a imagem formada sobre essa seção está 
mostrada na Figura 4.9 de onde é possí- 
vel perceber que o modelo (4.8) é mesmo 
uma aproximação do oscilador de Duffing- 
Ueda e não do mapa de Poincaré. 
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FIGURA 4.9: Imagem sobre a seção de 
Poincaré 2D da solução do modelo (4.8). 
A seção de Poincaré está no espaço de es- 
tados do modelo que, sendo discreto, não 
tem derivadas. O eixo vertical é y(k-—7), 
com 7=4. Isso corresponde a um espaço de 
estados em coordenadas de atraso (ver Se- 
ção 6.1). Fonte: (Aguirre e Billings, 1994). 


4.2.2 Definindo seções 
de Poincaré 


No início da seção foi definida a seção de 
Poincaré. Essa definição é bastante geral, de 
modo que normalmente há uma grande varie- 
dade de seções possíveis. Ainda que a ima- 
gem produzida em cada seção seja diferente, 
as características qualitativas e, portanto, a 
análise subsequente é a mesma. Contudo, há 
aspectos que devem ser observados na esco- 
lha de seções de Poincaré. 

No caso de sistemas de ordem n força- 
dos por funções periódicas, pode-se represen- 
tar o sistema no espaço IR” x $, como ilus- 
trado para o oscilador harmônico no Exem- 
plo 4.2.2, para o qual n = 2. Nesse caso, uma 
escolha prática para a seção de Poincaré é: 


P=((r,y,0)cRxS|0=%eR?, 


em que 9 €E [0, 27) e a amostragem de Poin- 
caré coincide com a amostragem estroboscó- 


pica. Ou seja, a amostragem ocorre para 
uma determinada fase do sinal periódico de 
entrada. Ou ainda, a amostragem é usada 
usando o sinal de entrada como relógio ou 
“marca passo”. Esse foi o procedimento se- 
guido nos exemplos 4.2.3 e 4.2.4. 


Uma situação um pouco mais difícil ocorre 
para o caso de sistemas autônomos. (Como 
não há entrada, não é imediatamente óbvio 
como definir a periodicidade da amostragem 
estroboscópica. Nesses casos, define-se uma 
seção de Poincaré e a amostragem é reali- 
zada com base nessa seção, como ilustrado no 
Exemplo 4.2.5. Aqui o critério é geométrico 
no espaço euclidiano ao contrário da amos- 
tragem estroboscópica, em que geometria no 
espaço cilíndrico corresponde a um critério 
temporal. 


Um ponto prático de fundamental impor- 
tância é a necessidade de interpolação para 
conseguir dados de qualidade na seção de 


Poincaré. A Figura 4.10 ilustra o problema. 
Pelo fato de fazer uso de integração numé- 
rica, a solução obtida em vez de ser uma fun- 
ção contínua no tempo G(xo, t) é uma sequên- 
cia de valores d(xo, kT;), em que k = 0,1,... 
e o tempo de amostragem T; pode ser igual 
ao intervalo de integração. Assim, a probabi- 
lidade de que um desses valores coincida com 
a seção de Poincaré é zero. Ao invés, há va- 
lores um logo antes e outro logo após a seção 
P, indicados por losangos na Figura 4.10. 


FIGURA 4.10: Interpolação na seção de Poin- 
caré. Representação esquemática da interpola- 
ção necessária para encontrar valores sobre a se- 
ção de Poincaré. A partir de valores da trajetória 
imediatamente antes e após a seção (indicados 
por losangos), ajusta-se uma reta, que é usada 
para obter-se o valor interpolado, indicado por 
um ponto preto. Ver detalhe em Figura 4.11. 


Portanto, para obter uma estimativa do 
valor que se teria sobre P (o ponto preto na 
figura), utiliza-se o artifício da interpolação, 
que por simplicidade pode ser linear: 


que está na forma de uma reta dada por 


yp = B+azxp. O procedimento é ilustrado 
no Exemplo 4.2.5. 


FIGURA 4.11: Detalhe da interpolação na se- 
ção de Poincaré. O valor da coordenada 1 sobre 
a seção de Poincaré P, yp, pode ser obtida por 
uma regra de três simples. 


Exemplo 4.2.5 


Neste exemplo considera-se o sistema 
de Róssler (10.26), que para (a,b,c) = 
(0,398, 2, 4) tem por conjunto limite w o 
atrator caótico indicado na Figura 4.12a. 

Uma seção de Poincaré para o sistema 


de Róssler pode ser escolhida como: 


c— vc2 — 4ab 
E (tono) ERA | — a oh (4.9) 


ou seja, é um semiplano, localizado na 
coordenada x do ponto fixo e que é perfu- 
rada pela trajetória no sentido de valores 
crescentes dessa coordenada. As interse- 
ções de uma trajetória com PP, estão in- 
dicadas por círculos na Figura 4.12a. No 
detalhe mostrado na Figura 4.12b é pos- 
sível ver que nenhum valor obtido via in- 
tegração numérica — indicados por círcu- 
los — coincide precisamente com P,. Por- 
tanto, procede-se a uma interpolação li- 
near (ver QPoincRoss) a fim de obter 
valores que estão sobre a seção de Poin- 
caré, indicados por triângulos na figura. 

Numericamente, uma maneira de re- 
duzir a dispersão dos valores em torno da 


seção de Poincaré é reduzir o intervalo de 
integração. Isso, por outro lado, torna 
a simulação mais lenta, mas conforme o 
caso pode ser uma boa alternativa. Isso 
é ilustrado no Exemplo 4.2.6. 


FIGURA 4. E Atrator de Róssler e interseção com Pg 


(a) Atrator de Rôssler com a seção de Poincaré P, indicada; 
(b) detalhe. Em cada trecho de trajetória toma-se um valor 
(amostrado) logo antes e um logo depois da seção. Com esses 
valores indicados por () determina-se a reta de interpolação e os 


valores correspondentes sobre a seção de Poincaré, indicados por 


A O 


A Figura 4.13 mostra o mapa de pri- 
meiro retorno à seção P, usando as coor- 
denadas (—yn,—Un41)- 


= 4 
= . 
4 á A 
al 
0< 
0 2 4 6 8 10 12 


FIGURA 4.13: Mapa de primeiro retorno 
de P, do atrator de Róssler. Valores negati- 
vos da coordenada y, foram usados para que 
a parábola apareça com um máximo, apenas 
por questões visuais (QPoincRoss). 


Assim como o mapa logístico, o mapa 


de primeiro retorno do sistema de Rós- 
sler para os valores de parâmetros usa- 
dos também é uma parábola. Isso sugere 
que ciclos no atrator de Róssler têm com- 
portamentos análogos a sequências pe- 
riódicas de iteradas do mapa logístico. 
Em particular, da mesma maneira que o 
mapa logístico apresenta uma rota para 
o caos via cascata de bifurcações flip, O 
sistema de Róssler também chega ao caos 
por uma cascata de duplicação de pe- 
ríodo (de ciclos). Assim como o atrator 
caótico do mapa logístico é formado por 
infinitos pontos fixos instáveis, o atrator 
de Róssler é formado por infinitas órbi- 
tas periódicas instáveis, UPOs (do inglês 
unstable periodic orbit). 


Exemplo 4.2.6 


Este exemplo considera o sistema de Lo- 
renz (3.22) para (0,D,17) = (10,8/3,28). 
Um dos aspectos que se deseja aten- 
der ao definir uma seção de Poincaré é 
que ela seja visitada a cada revolução 
pelo espaço. Uma seção de Poincaré de- 
finida somente em uma asa do atrator de 
Lorenz não é perfurada durante revolu- 
ções sobre a outra asa. Usando argumen- 
tos de simetria, Letellier e colegas argu- 
mentaram que para o atrator de Lorenz 
uma seção de Poincaré viável é composta 
de duas componentes, uma para cada asa 
do atrator (Letellier et al., 1994). A te- 
oria de toros limitantes pode ser usada 
para determinar o número de componen- 
tes necessários para se ter uma seção de 
Poincaré (Tsankov e Gilmore, 2004). 


Considere a seguinte matriz (Letellier 
et al., 1994) 


ED O 
qe po qo (4.10) 
(ARRRR NR 


Seja G(xo,t) uma solução do sistema de 
Lorenz, então, yó(xo,t) também é uma 
solução desse sistema. Multiplicar por 7, 
corresponde a trocar os sinais algébricos 
das coordenadas x e y, mantendo z inal- 
terada. A matriz y caracteriza a simetria 
do sistema de Lorenz, que é do tipo ro- 
tação (Gilmore e Lefranc, 2002). 

Com base em argumentos de simetria, 
é possível definir uma seção de Poincaré 
utilizando a variável que é invariante sob 
a ação da referida simetria, caracterizada 
por 9. No caso do atrator de Lorenz essa 


variável é z. Portanto, pode-se definir 


Po mou cho | DO 

(4.11) 
que se assemelha à seção utilizada por 
Lorenz em seu artigo original. A seção de 
Poincaré em (4.11) é composta de duas 
componentes (Fig. 4.14), pois as condi- 
ções % = 0 e Z < O correspondem aos 
valores máximos de z, sem distinguir em 
que asa o sistema se encontra. Em outras 
palavras, P, independe do sinal algébrico 
de x ey. 

Outro aspecto em que o traçado da 
seção de Poincaré para o sistemas de Lo- 
renz difere daquele descrito no Exem- 
plo 4.2.5 para o sistema de Róssler 
refere-se ao procedimento de interpola- 
ção. Para ver a origem dessa diferença, 
note que na escolha de (4.9) para o 
sistema de Róssler, a condição x, = 


eve dab refere-se diretamente a uma co- 
ordenada do espaço, ao contrário de 2%, = 
0, pois no presente exemplo, 2 não é uma 
das coordenadas. Assim, o procedimento 
de interpolação seguido para o caso do 
sistema de Róssler não pode ser direta- 
mente usado aqui. 


FIGURA 4.14: Atrator de Lorenz e P, 
de duas componentes. Devido à simetria 
(de rotação) do atrator de Lorenz, a se- 
ção de Poincaré P, em (4.11) é composta 
de duas componentes, indicadas nesta figura 
(QpoincLor). 


Sobre a necessidade de algum meca- 
nismo de aproximação, basta notar que 
numericamente não é viável testar uma 
condição de igualdade, mas deve-se tes- 


tar algo como |Z,,| < e, sendo e uma tole- 
rância que não deve ser pequena demais, 
sob a pena de não conseguir detectar a 
passagem da trajetória por P,. Para va- 
lores pequenos do intervalo de integra- 
ção, o risco de não detectar uma passa- 
gem é menor e e pode ser escolhido menor 
também. Contudo, para valores maiores 
do intervalo de integração, alguma forma 
de “interpolação” é necessária para se ob- 
ter dados com qualidade um pouco me- 
lhor (ver Exercício 4.4). 

Para gerar o clássico mapa de pri- 
meiro retorno para o atrator de Lorenz 
é necessário levar em conta a simetria do 
atrator. Note que ao cruzar uma com- 
ponente de 'P, as coordenadas no plano 
x —y são (XY) e, ao cruzar a outra 
componente de P,, temos (—zn, — Yn). 
Como *P, é composta de ambas compo- 
nentes, podemos levá-las em conta simul- 


taneamente tomando o módulo das coor- 


denadas, como na Figura 4.15. 

Uma outra seção de Poincaré de duas 
componentes — chamada de conjunto de 
Poincaré (Letellier et al., 1994) — é defi- 
nida como: 


Pe = [Gomszn) ER? |zn=Vb(r-1), ên <obu 
(Gomsz) ER? |2n=-b(r-1), ên> o), (4.12) 


que, segundo os autores, é numericamente 
mais vantajosa que P, (Letellier et al., 
1994) (ver Exercício 4.6). 


10 12 Ei 16 18 
FIGURA 4.15: Mapa de primeiro retorno 
de P, do atrator de Lorenz. Em função da 
simetria, usa-se o módulo de x,, pois x, em 
uma componente da seção de Poincaré cor- 
responde a —x, na outra (OpoincLor). 


4.2.3 Bifurcações de ciclos 


Com a ajuda da seção de Poincaré, voltemos 
a considerar a bifurcação de ciclos. Inicial- 
mente, imaginemos a situação de um fluxo 


com ponto fixo estável. É razoável supor que 
na vizinhança desse ponto fixo não haja solu- 
ções fechadas, pois o campo vetorial aponta 
na direção do ponto fixo. Pela variação de 
um parâmetro u o ponto fixo torna-se ins- 
tável e, assim, uma condição inicial próxima 
ao ponto fixo dá origem a uma trajetória di- 
vergente. Imaginemos ainda que essa traje- 
tória, sob a ação de não linearidade, fique 
confinada no espaço e seja atraída para um 
ciclo limite. Desejamos ver como esse cenário 
pode ser descrito em uma seção de Poincaré. 


Enquanto o ponto fixo do fluxo for está- 
vel, o conjunto limite w é um ponto que não 
tem interseção com uma seção de Poincaré 
genérica. Portanto nesse estágio, a seção de 
Poincaré não é perfurada e dizemos que não 
há ciclos, como indicado na Figura 4.16b. 


(a) 


(b) 


sem ciclos 


HU < We H> He 


FIGURA 4.16: Bifurcação sela-nó de ciclos. (a) 
Diagrama de bifurcação sela-nó de ponto fixo; 
(b) não há ciclos antes da bifurcação; (c) após a 
bifurcação aparece um ciclo estável e outro ins- 
tável. Na seção de Poincaré os ciclos são pontos 
de equilíbrio, como em (a). 


Para um certo valor crítico do parâme- 
tro ue O ponto fixo torna-se hiperbólico e 
essa condição corresponde a uma bifurcação. 
Sobre a seção de Poincaré surge um ponto 
fixo (hiperbólico), correspondente a um “ci- 
clo de amplitude nula”. Se o parâmetro for 


aumentado além de qc surge um ciclo estável 
— de amplitude mensurável — e um instável 
no fluxo que na seção de Poincaré aparecem 
como pontos fixos estável e instável, como 
visto na Figura 4.16c. Assim, o diagrama de 
bifurcação do mapa de Poincaré corresponde 
ao da sela-nó, ilustrado na Figura 4.16a. Por- 
tanto, uma bifurcação sela-nó do ponto fixo 
de um mapa de Poincaré corresponde à bi- 
furcação sela-nó de ciclo do fluxo correspon- 
dente. No ponto de bifurcação do fluxo são 
criados ciclos estável e instável. 


O mesmo raciocínio pode ser seguido para 
outras bifurcações de ciclos. Considere, por 
exemplo, a bifurcação transcrítica ilustrada 
na Figura 4.17. 


H< He U> He 


FIGURA 4.17: Bifurcação transcrítica de ciclos. 
(a) Diagrama de bifurcação transcrítica de ponto 
fixo; (b) e (c) antes e depois da bifurcação há dois 
ciclos. Estes mudam de estabilidade na bifurca- 
ção. Neste exemplo um deles muda de posição, 
em função do parâmetro de bifurcação q. 


Se essa bifurcação é de pontos fixos de um 
mapa de Poincaré, então corresponde à bifur- 
cação de ciclos do fluxo respectivo. Assim, na 
bifurcação transcrítica, um ciclo estável e um 
ciclo instável invertem sua condição de esta- 


bilidade no ponto de bifurcação, u = Mc, € O 
ciclo estável perde a estabilidade, sendo que 
o ciclo instável passa a ser estável. 


Na bifurcação forquilha de ciclos, um ci- 
clo estável (Figura 4.18b), perde estabilidade 
dando origem a dois ciclos estáveis, como visto 
na Figura 4.18c. 


(b) 


H< He U> He 


FIGURA 4.18: Bifurcação forquilha de ciclos. 
(a) Diagrama de bifurcação forquilha ponto fixo; 
antes da bifurcação há um ciclo (b), e depois há 
três (c). Dependendo das condições iniciais o 
sistema converge para um ou outro ciclo estável. 


Sobre a seção de Poincaré cada ciclo (pe- 
riódico) dá origem a um ponto, que corres- 
ponde a um ponto fixo do mapa de Poin- 
caré. Assim, a bifurcação forquilha de ciclo 
em fluxos corresponde à bifurcação forquilha 
de ponto fixo nos mapas de Poincaré corres- 


pondentes (Figura 4.184). Se tomarmos uma 
condição inicial próxima a um dos ciclos es- 
táveis, sob a ação do campo vetorial, surge 
uma trajetória que converge para o ciclo es- 
tável mais próximo. De certa maneira, o ci- 
clo instável serve de separatriz das bacias de 
atração dos ciclos estáveis. Portanto, o con- 
junto limite w está sobre um ciclo estável ou 
sobre o outro. 


Suponha que, por medição, tenhamos 
acesso a dados sobre um ciclo estável com 
“período um”, ou seja, a trajetória se repete a 
cada revolução no espaço. Com essa informa- 
ção apenas não é possível saber se esse ciclo 
surgiu por meio de alguma bifurcação nem 
qual das bifurcações descritas até aqui teria 
ocorrido. Uma situação diferente é encon- 
trada com a próxima bifurcação a ser anali- 
sada: a duplicação de período, que dá origem 
ciclos de período dois, ou seja, a trajetória se 
repete a cada duas revoluções no espaço. Ve- 


jamos isso com um pouco mais de detalhe. 


Assim como descrevemos no caso da bi- 
furcação do tipo forquilha de um ciclo, come- 
çamos com um ciclo estável (Figura 4.19b). 
No ponto de bifurcação u = je O ciclo perde 
estabilidade, mas ao invés de produzir dois 
ciclos estáveis, um de cada lado, como na bi- 
furcação forquilha, é produzido um único ci- 
clo estável, de período dois, como indicado na 
Figura 4.19c. Note que essa nova órbita pode 
ser representada sobre uma fita de Móbius. 
O que aparece sobre a seção de Poincaré é o 
mesmo lugar geométrico da bifurcação for- 
quilha (compare as figuras 4.18a e 4.19a). 
Contudo há uma diferença fundamental: en- 
quanto que na bifurcação forquilha o sistema 
está quer sobre um ramo estável do diagrama 
de bifurcação quer sobre o outro, no caso da 
bifurcação de duplicação de período, os ra- 
mos estáveis do correspondente diagrama de 
bifurcação sobre a seção de Poincaré são vi- 


sitados alternadamente. Isso pode ser facil- 
mente compreendido notando que no fluxo 
existe uma única órbita de período dois que 
perfura a seção de Poincaré alternadamente 
nos pontos 1 e 2, conforme Figura 4.19c. 


(b) (c) 


<<] 
H< e > We 
FIGURA 4.19: Bifurcação de duplicação de pe- 
ríodo de ciclos. (a) Diagrama de bifurcação de 
duplicação de período; (b) e (c) antes da bifur- 
cação há um ciclos e depois há dois. O sistema 
opera sobre o ciclo estável e a trajetória inter- 
cepta a seção de Poincaré alternadamente entre 
os pontos 1 e 2. Compare com a Figura 4.lc. 


Portanto, uma duplicação de período de 
um ciclo em fluxos corresponde à bifurcação 
flip no respectivo mapa de Poincaré. Assim 
como a perda de estabilidade da órbita de pe- 


ríodo um deu origem a uma órbita estável de 
período dois na bifurcação de duplicação de 
período, essa nova órbita estável, por sua vez, 
pode sofrer uma bifurcação de duplicação de 
período, dando origem assim a uma órbita 
estável de período quatro. Portanto, à seme- 
lhança da cascata de bifurcações flip descrita 
na Seção 3.3.5, tem-se a cascata de bifurca- 
ções de duplicação de período, que é uma das 
rotas para o caos mais comuns e mais bem es- 
tudadas. Associada à cascata de duplicação 
de períodos está a constante de Feigenbaum 
— veja (3.42) —, apresentada na Seção 3.3.5. 
A Figura 8.9 mostra o diagrama de bifurca- 
ção para o sistema de Róssler. Note como 
esse diagrama revela uma cascata de dupli- 
cação de período de ciclos, pois se trata de 
um oscilador. 


4.3  Atratores Estranhos 


Até este ponto encontramos algumas men- 
ções a atratores estranhos. Nesta seção fa- 
zemos uma apresentação um pouco mais for- 
mal, cientes de que não há uma definição con- 
sensual de tais atratores. Neste livro trata- 
mos apenas de sistemas dissipativos ou seja, 
sistemas que, sob a ação do campo vetorial, 
contraem (dissipam) um certo volume de con- 
dições iniciais Vo no espaço de estados. Isso 
é ilustrado nesta seção. 


O ponto comum com relação aos demais 
atratores vistos até aqui é o fato de que um 
atrator estranho também é um objeto atra- 
tivo, ou seja, trajetórias próximas a ele são 
atraídas. Além disso, por ser um conjunto 
invariante sob a ação do campo vetorial ou 
mapa, uma vez sobre o atrator, a trajetó- 
ria permanece nele. Em outras palavras, um 
atrator estranho é um conjunto limite w (ver 


Seção 1.4). 

O exemplo a seguir mostra um caso mais 
simples, em que o conjunto limite w é um 
ciclo limite. 


Exemplo 4.3.1 


Considere o oscilador de Van der Pol des- 
crito pela Eq. 1.43. Duzentas condições 
iniciais aleatórias, com distribuição uni- 
forme, em torno de xo = [0,1 0,1]” foram 
usadas na integração numérica de (1.43), 
cujos resultados estão mostrados na Fi- 
gura 4.20. 


dx(tjiat 
—+ 
dx(tjjat 


FIGURA 4.20: Condições iniciais sob a 
ação de um campo vetorial. O conjunto de 
condições iniciais (t = 0) para o oscilador 
de Van der Pol (a) contrai em ambas as di- 
reções (u= — 0,5). Os conjuntos de pon- 
tos mostrados referem-se a t=0, t=2 e t=4; 
(b) é comprimido transversalmente ao ciclo 
limite, sendo que sobre o ciclo limite a posi- 
ção relativa dos pontos se mantém (=(0,5). 
Os conjuntos de pontos mostrados referem- 
se a t=0, t=10 e t=30; 


A origem é um ponto fixo deste sis- 


tema (ver Exercício 1.12), que pode ser 
estável ou instável, dependendo do valor 
de u. Para uy = —0,5, a origem é um foco 
estável. Portanto, as trajetórias que têm 
origem no conjunto de condições iniciais 
são aproximadas uma das outras ao longo 
do tempo sob a ação do campo vetorial, 
como ilustrado na Figura 4.20a. De ma- 
neira informal diremos que o “conjunto 
de condições iniciais é contraído”. 
Tomando-se yu = 0,5, o cenário é bem 
diferente, pois nesse caso o ponto fixo tri- 
vial (na origem do plano de fases) é um 
foco instável e o campo vetorial expande- 
se em ambas as direções de forma espiral. 
Nesse caso, sob ação do campo ve- 
torial, o conjunto de condições iniciais 
se expande até ficar sobre o ciclo limite, 
como mostrado na Figura 4.20b. Uma 
vez sobre o ciclo limite, a posição rela- 
tiva dos pontos se mantém. Sob a ação 


do campo vetorial, condições iniciais ex- 
ternas ao ciclo limite dão origem a traje- 
tórias que convergem para o ciclo limite. 


Nos exemplos acima, vimos que o con- 
junto limite w são objetos de dimensão in- 
teira. Para o caso em que a origem é estável, 
a dimensão do conjunto limite w é 0, pois to- 
das as trajetórias começadas em x(0) e W 
terminam em um ponto de equilíbrio estável. 
Para o caso em que a origem do oscilador 
de Van der Pol é instável, as trajetórias ini- 
ciadas em x(0) E Vo terminam sobre o ciclo 
limite, que é um objeto de dimensão 1. 

A dimensão do objeto não deve ser con- 
fundida com a dimensão do espaço que con- 
tém o objeto. Claramente, um ciclo limite de 
período 1 requer ao menos um espaço bidi- 
mensional para existir, contudo, o ciclo limite 
tem dimensão 1. Um ciclo de período dois re- 
quer um espaço de dimensão no mínimo três 


para existir, mas tal ciclo ainda é um objeto 
de dimensão 1. A dimensão do objeto pode 
ser entendida como o número mínimo de co- 
ordenadas necessário para especificar uma lo- 
calização sobre o objeto, dado um ponto de 
referência. Outra maneira de pensar na di- 
mensão é considerar a dimensão do espaço 
euclideano local, ou seja, na vizinhança de 
um ponto do objeto. No caso do ciclo limite o 
espaço euclideano na vizinhança de um ponto 
é uma reta, que tem dimensão 1, como an- 
tevisto. No caso de um toro T2, o espaço 
euclideano na vizinhança de um ponto é um 
plano, ou seja, um toro T2 tem dimensão 2, 
apesar de requerer ao menos três dimensões 
para existir. 


O comportamento assintótico de fluxos 
foi visto na Seção 1.4. Voltamos agora a 
esse tema, lançando mão de algumas defi- 
nições. Eckmann propôs a seguinte defini- 
ção para atrator (Eckmann, 1981), conforme 


discutido em (Fiedler-Ferrara e Prado, 1994, 
p.86). O objeto 4 é um atrator de um fluxo 
ó(a,t) do campo vetorial f se: 


1. A é invariante sob a ação de f: 
2. A tem uma vizinhança contraente; 


3. o fluxo d(ax,t) é recorrente, ou seja, a 
trajetória que começa em x, € 4, de- 
pois de um tempo suficientemente longo, 
volta arbitrariamente próximo de x; 


4. o fluxo não pode ser decomposto, ou 
seja, 4 não pode ser dividido em duas 
partes invariantes não triviais. 


Um atrator é estranho se sua dimensão 
não for inteira, ou seja, é uma dimensão frac- 
tal. Após fornecer a definição de atrator, 
Eckmann classificou como atratores estranhos 
aqueles que apresentam sensibilidade extrema 


a condições iniciais. Poucos anos depois, Gre- 
bogi e colegas mostraram que existem atra- 
tores com dimensão fractal, porém que não 
apresentam sensibilidade a condições inici- 
ais (Grebogi et al., 1984). De modo que é 
possível convencionar que o adjetivo estra- 
nho relaciona-se à geometria do atrator e 
o adjetivo caótico, à dinâmica, em particu- 
lar à sensibilidade extrema a condições ini- 
ciais. Note-se que Eckmann, que possivel- 
mente ainda não conhecia os exemplos mos- 
trados por Grebogi e colegas, entendia que 
atratores estranhos e atratores caóticos eram 
sinônimos. 


Apesar dos exemplos providos por Gre- 
bogi e colaboradores, a regra é que atratores 
estranhos são caóticos. Como mencionado, o 
atrator estranho é fractal. Em alguns casos, 
essa fractalidade é facilmente reconhecida na 
respectiva seção de Poincaré, como ilustrado 
esquematicamente na Figura 4.8, em que a 


imagem formada corresponde ao atrator do 
oscilador de Duffing-Ueda para um valor es- 
pecífico da amplitude da função forçante. 


Para entender o significado de sensibili- 
dade extrema a condições iniciais, considere 
o resultado ilustrado na Figura 4.20. Nesses 
casos é possível verificar (ver Exercício 4.1) 
que condições iniciais arbitrariamente próxi- 
mas, resultam em trajetórias, também arbi- 
trariamente próximas Vt. Para um fluxo que 
exiba sensibilidade extrema a condições ini- 
ciais, duas trajetórias com origem em con- 
dições iniciais arbitrariamente próximas, de- 
pois de um tempo, estarão macroscopica- 
mente afastadas sobre o atrator (Eckmann, 
1981). Como visto adiante, sensibilidade a 
condições iniciais resulta da divergência local 
de trajetórias no espaço de estado, mesmo 
que as trajetórias estejam sobre o atrator. 


A seguir apresentamos uma definição para 
caos, conforme discutido em (Monteiro, 2006, 


Sec. 10.2). Um atrator À é caótico se: 
1. apresenta transitividade topológica; 
2. as órbitas periódicas são densas em A; 


3. se À apresenta sensibilidade extrema a 
condições iniciais. 


As órbitas periódicas serem densas em A 
significa que dado um ponto x E À, existe 
uma órbita periódica arbitrariamente próxima 
de x. Como o atrator é caótico, tais órbitas 
periódicas são necessariamente instáveis. 

Como discutido na Seção 1.4, transitivi- 
dade topológica requer que uma trajetória 
sobre o atrator, depois de algum tempo fi- 
nito, retorne à vizinhança do ponto de par- 
tida, sendo que tal vizinhança pode ser ar- 
bitrariamente pequena. Essa propriedade é 
equivalente à de recorrência na definição de 
Eckmann. Como curiosidade, menciona-se 
que, como descrito no Capítulo 8, pensando 


em como representar recorrências de maneira 
visual Eckmann propôs o conceito de gráficos 
de recorrência, que se tornaram populares na 
análise não linear de sinais. 


Exemplo 4.3.2 


Considere o conjunto de equações que 
produzem o atrator corda (Aguirre e Le- 
tellier, 2011): 


t =>-y-z-—-arx+aFf 
y =zy-—-baz-—-v+G (4.13) 
2 =bry+zz-az, 


comia be os A Os Or 
que é uma modificação do sistema de Lo- 
renz'84 (Lorenz, 1984). Para esses pa- 
râmetros, a solução de (4.13) converge 
para um atrator estranho com caracterís- 
ticas bastante diferentes, dependendo da 


região do espaço de estados, como pode 
ser constatado visto na Figura 4.21. 


FIGURA 4.21: Projeções do atrator 
corda obtido simulando-se (4.13) com 
fab REC = (025 40 8010) 


Na parte central da figura é possí- 
vel reconhecer a “corda” formada por tre- 
chos de trajetórias próximas e “retorci- 
das”. Ao longo da corda a estrutura do 
fluxo é mais complicada que na parte 
posterior do atrator, onde a estrutura lo- 
cal do fluxo é muito simples. 

Um outro aspecto curioso sobre esse 


atrator é que, pelo fato de a corda ser 
praticamente paralela ao eixo x, essa ca- 
racterística do atrator não é perceptível 
na projeção sobre o plano y— (ver Exer- 
ciclo 


4.3.1 Mapa do padeiro 


Um dos mapas paradigmáticos usados para 
entender alguns dos fenômenos matemáticos 
envolvidos em certos atratores caóticos é o 
mapa do padeiro. Esse mapa está relacio- 
nado ao também conhecido mapa da ferra- 
dura devido a Smale , ou simplesmente mapa 
da ferradura. Esse nome foi dado em ho- 
menagem ao matemático americano Stephen 
Smale que, durante um período sabático no 
Instituto de Matemática Aplicada, no Rio 
de Janeiro, propôs o referido mapa (Smale, 


1967). 


O mapa do padeiro, que é uma aplicação 
do quadrado unitário nele mesmo, F : [0, 1]x 
[0, 1] — [0,1] x [0, 1], pode ser descrito como: 


Tp = 2%p-1 
se 0<zxp1<1/2 
” Yk-1 
Yk a 
F: (4.14) 


Tk =— 2XkA —1 
se 1/2<zp 1<l1 
— Yh-1 ne 


Yk 2 


Deve ser notado que podemos escrever 
duas matrizes jacobianas para o mapa F em 
(4.14), uma para O < x; 1 < 1/2 e outra 
para 1/2 < xp 4 < 1. Contudo, tanto uma 
matriz como a outra tem determinante igual 
a 1 (ver Exercício 4.8), o que indica que o 
mapa é conservativo, ou seja, sob a ação de 
F uma região tem sua área preservada. 

A fim de entender o efeito alcançado por 


esse mapa, considere a Figura 4.22. O qua- 
dro superior esquerdo mostra 3000 condições 
iniciais tomadas aleatoriamente, com distri- 
buição uniforme, dentro do retângulo es- 
querdo. Como todos esses valores satisfazem 
O < xx 1 < 1/2, utilizamos o primeiro par 
de equações em (4.14). O efeito alcançado 
é esticar o retângulo no sentido horizontal 
e contraí-lo no sentido vertical pelo mesmo 
fator. Como resultado desse processo, o con- 
junto de condições iniciais encontra-se agora 
no retângulo inferior do quadrado unitário, 
como visto na Figura 4.22b. Se prosseguir- 
mos, veremos que aproximadamente metade 
dos pontos está à esquerda de q = 1/2. Es- 
ses pontos voltam a ser tratados exatamente 
da mesma forma como ocorreu com o retân- 
gulo em Figura 4.22a. Contudo, o conjunto 
de pontos à direita de x = 1/2 tem um trata- 
mento diferente, descrito pelo segundo con- 
junto de equações em (4.14). No sentido ho- 


rizontal, esse conjunto é expandido com fa- 
tor 2, passando a ocupar o intervalo [1, 2] e, 
a seguir, trasladado para a esquerda de uma 
unidade. No sentido vertical, o conjunto é 
contraído por um fator de 2 e deslocado para 
cima de 1/2 unidade. 


FIGURA 4.22: Ação do mapa do padeiro. Itera- 
ções de (4.14): (a) conjunto de condições iniciais; 
(b) após uma iteração, (c) após três iterações, 
(d) após sete iterações (MbakerMap). 


A Figura 4.22 mostra que a ação do mapa 
do padeiro resulta em empilhar “camadas de 


condições iniciais” cada vez mais finas. À 
medida que o número de iteradas do mapa 
tende a infinito, o retângulo de condições ini- 
ciais assume gradualmente a estrutura de um 
conjunto de Cantor em duas dimensões. O 
nome foi dado em homenagem ao matemá- 
tico alemão Georg Cantor (1845-1918). O 
nome “mapa do padeiro” foi atribuído de- 
vido ao fato de que a ação que o mapa (4.14) 
exerce sobre um conjunto de condições inici- 
ais lembra a ação de um padeiro sovando um 
pouco de massa. Essa ação pode ser descrita 
como sucessivas ações de esticar a massa e 
dobrá-la sobre si mesma. Esses mesmos dois 
efeitos podem ser reconhecidos em vários sis- 
temas caóticos (Exercício 4.9). A ferradura 
de Smale emula precisamente a mesma ação 
— as soluções de ambos os mapas são topolo- 
gicamente conjugadas (ver Sec. 2.1.2) — e por 
isso é comumente associada ao mapa do pa- 
deiro, apesar de Smale não ter proposto um 


conjunto de equações para o mapa de ferra- 
dura. 


Voltando à Figura 4.22a, consideremos 
não somente as condições iniciais do lado es- 
querdo do quadrado unitário, indicadas em 
preto, mas imaginemos que haja o mesmo 
número de condições iniciais indicadas por 
pontos brancos no lado direito. Pode-se no- 
tar que à medida que o mapa do padeiro é ite- 
rado, as condições iniciais são gradualmente 
misturadas até que, para um número sufici- 
entemente grande de iteradas não é possível 
afirmar se em uma determinada região ha- 
verá um valor que teve origem em uma condi- 
ção inicial preta ou branca. Essa propriedade 
é uma consequência da sensível dependência 
a condições iniciais. 


Leitura Recomendada 


Uma visão geral de alguns dos pontos deste 
capítulo pode ser encontrada em outros livros 
texto, como (Fiedler-Ferrara e Prado, 1994; 
Monteiro, 2006). 


O atrator corda for apresentado pela pri- 
meira vez em (Aguirre e Letellier, 2011). Esse 
sistema é obtido a partir do sistema de Lo- 
renz'84 (Lorenz, 1984) substituindo-se os ter- 
mos não lineares da primeira equação pelos 
respectivos termos lineares. Alguns aspectos 
da topologia desse sistema foram discutidos 
em (Letellier e Aguirre, 2012). Gleison Ama- 
ral e Erivelton Nepomuceno propuseram um 
modelo chaveado afim por partes com diná- 
mica equivalente à do atrator corda (Amaral 
e Nepomuceno, 2018). 


Exercícios 


4.1. Mostre por simulação que o oscila- 
dor harmônico amortecido e o oscilador de 
van der Pol não apresentam sensibilidade ex- 
trema a condições iniciais e que o sistema de 
Róssler para a = 0,389, b= 2 e c = 4 apre 
senta tal sensibilidade. 


4.2. Utilize as séries temporais mostradas 
nas Figuras 4.2, 4.3 e 44 para argumentar 
que a dinâmica correspondente é periódica 
com períodos 1, 2 e 3, respectivamente. O 
que significa que um oscilador forçado tem 
uma solução de periódica de período p? Como 
definiria tal regime dinâmico no caso de um 
oscilador autônomo? 


4.3. Tente fazer um paralelo entre a dupli- 
cação de período de ciclo ilustrada no Exem- 
plo 4.1.1 e a análise da bifurcação flip feita 
na Seção 3.3.5. 


4.4. Discuta o procedimento aproximado 
de “interpolação” utilizado em QPoincLor. 


4.5. Use P. em (4.12) para obter o mapa de 
primeiro retorno para o atrator de Lorenz. 


4.6. Discuta as possíveis vantagens numé- 
ricas de se utilizar P. em (4.12), ao invés de 
P, em (4.11) e quais implicações há para a 
etapa de interpolação. 


4.7. Se o atrator corda (ver Exemplo 4.3.2) 
a variável x não for medida, mas tivermos 
acesso às variáveis y e z, é possível recons- 
truir a projeção sobre o plano y — z, como 
visto na Figura 4.21. Contudo, nessa proje- 
ção um aspecto importante do atrator “desa- 
parece”. Discuta o problema de analizar da- 
dos desse sistema a partir da variável y e/ou 
z. 


4.8. Mostre que o mapa do padeiro, dado 
por (4.14) é conservativo. Procure verificar 
se o mapa de Hénon (2.6) tem a mesma pro- 
priedade. 


4.9. Descreva os efeitos de esticamento e 
de dobra no sistema de Rossler. 


Parte Il 
Análise de Dados 


Capítulo 5 


Caracterização de 
Atratores 


Este capítulo trata da caracterização de atra- 
tores. À ideia central é procurar métricas que 
quantifiquem aspectos relevantes dos atrato- 
res. Isso é importante na análise e compara- 
ção de regimes dinâmicos. 


Há diversas formas de caracterizar atra- 


tores, sendo que já foram vistas algumas. Re- 
tratos de fases, mapas de Poincaré e mapas 
de primeiro retorno são alguns exemplos de 
ferramentas comumente utilizadas para ca- 
racterizar graficamente esses objetos dinâmi- 
cos. 


Neste capítulo são estudadas algumas me- 
didas quantitativas para a caracterização de 
atratores. Dentre elas encontram-se os expo- 
entes de Liapunov, descritos na Seção 5.1. O 
conceito de entropia é revisto no contexto da 
caracterização de atratores na Seção 5.2. À 
dimensão fractal é apresentada na Seção 5.3. 
Por fim, a Seção 5.4 apresenta alguns pon- 
tos que devem ser atendidos pelos conjuntos 
de dados utilizados para a caracterização de 
atratores. 


Um ponto importante a observar é que, 
na exposição dos temas deste capítulo, dá-se 
ênfase aos aspectos conceituais e não aos al- 
goritmos numéricos disponíveis para estimar 


os indicadores usados na caracterização de 
atratores. Algoritmos para cômputo desses 
indicadores podem ser encontrados gratuita- 
mente na Internet. 


5.1 Expoentes de Liapunov 


De maneira muito simplificada, os expoen- 
tes de Liapunov em sistemas não lineares de 
certa forma correspondem ao conceito de au- 
tovalores para sistemas lineares. Mais espe- 
cificamente, os expoentes de Liapunov quan- 
tificam as taxas médias locais de expansão 
e contração do fluxo (no caso contínuo) no 
espaço de fases. Tais expoentes são defini- 
dos tanto para sistemas contínuos como para 
discretos. Ambos são tratados em sequência. 


5.1.1 O caso contínuo: fluxos 


Considere a seguinte equação diferencial li- 
near 


TYU+HY=0, 


em que 7 > 0 é uma constante. Se em de- 
terminado instante to, y(to) = Yo, à evolu- 
ção dessa condição inicial é da forma y(t) = 
COS AS —1/7, em que a constante c pode 
ser determinada a partir da condição inicial 
como c = ye “o. Portanto a evolução da 
condição inicial é regida por 

u(t) = yo Noto), 

O estado de um sistema com n autovalo- 
res reais e distintos ds 4=1,...,n pode ser 
representado no espaço de estado IR” como 
um ponto. Se o movimento em cada coor- 
denada desse espaço for caracterizado por 
um desses autovalores, a evolução do sistema 


pode ser descrita pelas n projeções em cada 
coordenada, que, para o caso linear, podem 
ser indicadas como 


Yilt) = a en 5.1 
J j 


em que y;(t) e yo, São as projeções do sistema 
e sua condição inicial sobre o j-ésimo auto- 
vetor. Para fins de argumentação, usamos os 
autovetores como coordenadas do espaço de 
estado. No caso linear, isso corresponde à 
forma canônica de Jordan quando os autova- 
lores são reais e distintos. Assim, se À; >0 
em (5.1) a respectiva componente, y;(t), di- 
verge. 

Considerando ainda o mesmo sistema 
com n autovalores reais, em vez de acompa- 
nhar como uma única condição inicial y, = 
[yr Vo, --- Yo,]” evolui com o tempo no es- 
paço IR”, deseja-se entender como evolui uma, 
hiper-esfera (de condições iniciais) com vo- 
lume inicial vo (Fig. 5.1). 


Fei 


FIGURA 5.1: Evolução de volume de condições 
iniciais. O volume inicial é proporcional ao pro- 
duto vo X Yo, Yo, 0; € O volume em um instante t 
é dado por (5.3). A hiper-esfera dilata ao longo 
das direções instáveis, caracterizadas por À > 0, 
e contrai ao longo das estáveis, caracterizadas 
por e: 


O volume inicial vo é proporcional ao pro- 
duto dos eixos de tal esfera em to, ou seja, 
vo X YorVo, - -- Yo, assumindo-se que todos 
os valore são positivos. Isso está ilustrado na 


Figura 5.1. Para um sistema qualquer de di- 
mensão n, o volume em um instante qualquer 
é proporcional a 


vt) x Tito) (5.2) 


A fim de verificar como v(t) evolui a par- 
tir do volume inicial vo, basta acompanhar 
cada uma das componentes y;(t), que evolui 
de acordo com (5.1). Portanto, substituindo 
(5.1) em (5.2) tem-se 


Pig de (II vo) elt-to) Dj dy 
i=1 


x ug eltto) Li As, (5.3) 


Para sistemas conservativos o volume ini- 
cial mantém-se inalterado com o passar do 
tempo, ou seja, v(t) = v(to) = vo. Impondo- 
se essa condição à expressão do volume (5.3), 


tem-se que necessariamente 


t+) À; 
Vo vo el )Sj-a dis 


Dad = 1 


>= 0, (5.4) 
j=1 


uma vez que t Z to. Em palavras, para sis- 
temas conservativos o somatório das taxas 
de expansão e contração (autovalores) no es- 
paço de fases deve ser nulo. Por outro lado, 
no caso de sistemas dissipativos, tem-se que 
v(t) < v(to) = vo, O que resulta em 


>Aj<o0. (5.5) 
1=1 


Observando a Figura 5.1 percebe-se que 
há uma direção instável, ao longo da qual um 
segmento de reta dilata, e direções estáveis, 
ao longo das quais segmentos de reta con- 
traem. Chamando de d;(t) um segmento de 


reta na j-ésima direção! no espaço de esta- 
dos em IR”, sua evolução (linear) no tempo 
é dada por uma expressão análoga a (5.1). 
Partindo-se dessa expressão pode se escrever 


dit) = ditjevt O), ;=1,2,...,n 


t) E edilt-to) 
dj(to) 
Perdoa ds(t) 
A; E In Et (5.6) 


Deve ser notado que a análise feita acima 
considerou o sistema linear. No caso de um 
sistema não linear, comportamento exponen- 
cial somente pode ser garantido localmente. 
Isso significa que (5.6) só tem validade para 
segmentos de reta iniciais, d;(to), muito pe- 
quenos. 


!sso significa que, naquele ponto do espaço, d;(t) 
está na direção do j-ésimo autovetor, associado ao 
j-ésimo autovalor A;. 


Considerar d;(to) muito pequeno, como 
discutido acima, permite que continuemos as- 
sumindo expansões exponenciais localmente. 
Mas localmente onde? É necessário definir 
o lugar geométrico no espaço de estados ao 
longo do qual deve ser feita a análise. Esse 
lugar geométrico pode ser extenso, mas nesse 
caso é necessário considerar, em sequência, 
pequenas vizinhanças em torno dele. Como 
se deseja quantificar o atrator, é natural que 
ele seja o referido lugar geométrico. 


Considere o vetor de estado x(t), to<t<tr, 
em que to é um tempo suficientemente grande 
de forma que o sistema se encontre em estado 
estacionário, ou seja, o sistema já convergiu 
para o atrator a ser caracterizado, que é um 
conjunto limite w. Além disso, assume-se que 
tr—to seja grande o suficiente de maneira a se 
ter uma representação “completa” do atrator. 


Assim, a generalização da expressão (5.6) 
para o caso não linear deve garantir que d;(to) 


seja pequeno e que a órbita seja suficiente- 
mente longa, ou seja, 


1 : 

A; = lim lim in [io | 
t>00 d;(to)—>0 t — to 
qu 1 Dis; (5.7) 


em que os segmentos d;(to) são tomados na 
vizinhança de uma órbita longa. Na expres- 
são (5.7) — que é a definição dos expoentes 
de Liapunov, A;, de um atrator de um sis- 
tema não linear geral — o primeiro limite ga- 
rante que a trajetória considerada é suficien- 
temente longa, de maneira a visitar todas as 
regiões do atrator, e o segundo limite garante 
que a análise seja local, ponto a ponto. 

No caso não linear as taxas de convergên- 
cia e divergência na vizinhança de pontos fi- 
gos são dadas pelos autovalores da matriz ja- 
cobiana avaliada nesses pontos (ver Sec. 3.1). 
A expressão (5.7) permite, em princípio, de- 
terminar as taxas de contração e expansão 


avaliando o comportamento local de peque- 
nos segmentos, sem requerer a matriz jacobi- 
ana. 


A atratores do tipo ponto fixo em IR” es- 
tão associadas mn direções de convergência e, 
portanto, mn expoentes de Liapunov negati- 
vos. No caso de ciclos limite, o movimento 
ao longo desse ciclo nem converge nem di- 
verge. O movimento ao longo do ciclo limite 
pode ser visto como sendo não dissipativo. A 
direção associada ao movimento do ciclo li- 
mite pode ser eliminada definindo-se uma se- 
ção de Poincaré II (Sec. 4.2), como mostrado 
na Figura 5.2b. Portanto, no caso de um ci- 
clo limite estável (atrator) em IRÊ, além da 
direção não dissipativa existem outras duas 
“direções” convergentes. Essas direções de- 
vem ser compreendidas no sentido geral, ou 
seja, trata-se de uma variedade estável de di- 
mensão 2. Por fim, para o caso de um toro 
em IRº há duas “direções” não dissipativas e 


apenas uma convergente, como ilustrado na 
Figura 5.2c, em que o toro propriamente dito 
não é mostrado. 
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FIGURA 5.2: Atratores regulares em IR2. (a) A 
um atrator do tipo ponto fixo em IRê estão asso- 
ciadas três direções locais convergentes. (b) No 
caso de um ciclo limite em IR?, pode-se ver com 
o auxílio da seção de Poincaré II, que a esse ciclo 
estão associadas duas direções locais convergen- 
tes. A direção ao longo do ciclo limite é não 
dissipativa. (c) No caso de um toro em Rê, 
há duas direções de estabilidade neutra e ape- 
nas uma convergente, como pode ser visto na 
seção de Poincaré, 7 € IR, da seção de Poincaré 


Ile TRA. 


Pelas razões apontadas no parágrafo an- 
terior, diz-se que todos os expoentes de Lia- 
punov (EL) de atratores que são pontos fixos 
são negativos. Um ciclo limite no espaço de 
fases IR” tem um EL nulo (correspondente à 
única direção não dissipativa) etem n—1 EL 
negativos. Semelhantemente, um toro T? em 
IR” tem dois EL nulos e n — 2 EL negativos. 


O que se pode esperar dos EL no caso 
de atratores caóticos? Por um lado, sabe-se 
que alguns dos fenômenos envolvidos em al- 
guns sistemas caóticos são o de esticamento 
e o de rasgo. Ambos produzem uma separa- 
ção local de trajetórias no espaço de estados, 
que está associada a uma direção instável e, 
portanto, a um EL positivo. À semelhança 
do ciclo limite, ao longo da trajetória caó- 
tica associa-se uma direção não dissipativa, 
com EL nulo. Assim, por enquanto, tem-se 
A > 0e À = 0. Mas por se tratar de atra- 


tores de sistemas dissipativos? o somatório 
dos EL deve ser negativo, ver (5.5). Isso re- 
quer a existência de um terceiro EL que seja 
negativo, de maneira a satisfazer a restrição 
(5.5). O argumento acima esclarece porque 
no caso de sistemas contínuos são necessárias 
pelo menos três dimensões no espaço de fases 
para se ter caos. 


Uma das assinaturas do caos determinís- 
tico é a extrema sensibilidade a condições ini- 
ciais. Como consequência disso, duas con- 
dições iniciais arbitrariamente próximas dão 
origem a duas trajetórias que, com o passar 
do tempo tornam-se descorrelacionadas tem- 
poralmente, apesar de que ambas ainda es- 
tão sobre o mesmo atrator. Isso é ilustrado 
no próximo exemplo. 


2Em IRº um attrator de sistema dissipativo não 
tem volume. 


Exemplo 5.1.1 


Apesar de Henri Poincaré ter antevisto a 
existência de sistemas com extrema sen- 
sibilidade a condições iniciais, foi Edward 
Lorenz que, no início da década de 1960 
constatou essa propriedade pela primeira 
vez utilizando um computador a válvula. 
O evento foi descrito da seguinte forma 
por James Gleick (Gleick, 1993, p. 16): 


“Um dia no inverno de 1961, 
desejoso de examinar uma 
sequência mais longa, Lorenz 
tomou um atalho. Em vez de 
iniciar a simulação do princí- 
pio, começou do meio. Para 
fornecer à máquina as con- 
dições iniciais, ele digitou os 
números a partir da impres- 
são que tinha de uma simu- 


lação anterior. Desceu pelo 
corredor para evitar o ba- 
rulho e tomar uma xícara 
de café. Ao regressar uma 
hora depois, viu algo inespe- 
rado, algo que plantou uma 
semente para uma nova ciên- 
clas 

Para tentar reproduzir qualitativa- 
mente o que Lorenz viu naquele dia, 
basta simular o sistema (3.22) a par- 
tir de duas condições iniciais próximas. 
Usando be Bo Be 
condições iniciais go = [-[10-1020]” e 
£o = [-10,01-10,01 20,01)” obtém-se os 
resultados mostrados na Figura 5.3 (ver 
Exercício 5.1). 


FIGURA 5.3: Evolução temporal do sis- 
tema de Lorenz. A divergência temporal 
deve-se a dois fatos. Primeiro, as condições 
iniciais usadas são levemente diferentes. Em 
segundo lugar, por ser caótico para os valo- 
res de parâmetros usados, o sistema apre- 
senta extrema sensibilidade a condições ini- 
ciais (QsimLorenzRK.m). 


Uma consequência da extrema sensibili- 
dade a condições iniciais é que até mesmo 
utilizando as mesmas condições iniciais, se 
os cálculos em computador digital forem fei- 
tos de forma diferente, há duas trajetórias 
diferentes. A razão para isso é que peque- 
nas diferenças de algoritmos e formas de re- 
presentação numérica em nível de máquina, 
resultam em pequenas diferenças que, graças 
à ação local de divergência do fluxo — quan- 
tificada pelo expoente de Liapunov positivo 
— são amplificadas com o passar do tempo 
(Mendes e Nepomuceno, 2016; Nepomuceno 
et al., 2018). 


5.1.2 O caso discreto: mapas 


Seja o mapa 21 = F(ax,). Considere duas 
condições iniciais que diferem por um pe- 
queno valor d9: xo e xo + do. Após uma 
iteração do mapa F, tem-se x, = F(xo) 


ex = F(xo + do). Se F for linear, 
2, +61, = F(x9+ 09)e |d1| = |d0]e*, em que 
À mede a taxa de convergência ou divergência 
exponencial de F após uma iteração. Por- 
tanto, para a primeira iteração, pode-se es- 
crever |ô1| = |ôo/e2, e para a (k + 1)-ésima 
iteração tem-se 

dem] 2 ã 


ór 


Ôj+1 


Ôk 


que é uma expressão análoga a (5.6), o que 
não deve gerar surpresa, uma vez que o con- 
ceito de expoente de Liapunov é o mesmo 
tanto para fluxos como para mapas. Os ex- 
poentes de Liapunov são definidos como a 
média de À tomada ao longo de uma longa 
trajetória, ou seja, 


À =h (5.8) 


69) 


que é análoga à Eqg.5.7. No caso de ma- 
pas, é conveniente, desenvolver a expressão 
(5.9) um pouco mais. Assumindo-se linea- 
ridade após N iterações, por analogia com 
(5.8), tem-se 


nl = |6ol(e*)N 
|ôn| NÃ 
1, - e 
jôo| 

o 1 lôy 


Assumindo linearidade ôy = FM(xo + 
do) — FM (x,), ou seja, essa aproximação é 
válida se do for pequeno (ver Exercício 5.2). 
Substituindo esse resultado em (5.10) e to- 
mar o limite para 66 > 0, ou seja, 


FN(xo + 60) — EN (xo) 
do 


A= lim de lim in 
Nsoo ôd0=0 


= lim im 


0" (aro) 
ÔLo 


(5.11) 


N>o0 


em que OF" (x9)/dxo é conhecida como a 
“matriz jacobiana produto” e que pode ser 
escrita como: 


oFN 
O =DF(en-1)DF(2n-o)... DF(x0) 
Zo 
OF N (x) OF) OF (a) 
dx g=% dx ic dz dim 
OF (a 

= a (5.12) 

L=Lo 


Portanto, substituindo (5.12) em (5.11) 
chega-se a 


N-1 
A= lim —ln aii, 
N-oo N j=0 da LL; 
N-1 
o 1 OF (a) 
a A oa | ao O 


que mostra que a razão de pequenas distân- 
cias entre evoluções definidas por mapas (ver 


Eq. 5.9) é dada pela matriz jacobiana. No 
caso de fluxos é dado pela exponencial da 
matriz jacobiana.? Se o mapa F tiver dimen- 
são maior que 1, então In| - | é interpretado 
como o logaritmo dos autovalores da matriz 
jacobiana. 

Dois pontos fundamentais que merecem 
atenção nas definições (5.7) e (5.13) é que 
os respectivos cálculos devem ser efetuados 
ao longo de órbitas suficientemente longas 
(N — 00). Além disso, tais definições se ba- 
seiam fortemente na expectativa de que dife- 
renças entre duas condições iniciais evoluam 
de forma exponencial. Deve ser lembrado de 
que essa expectativa somente é realista lo- 


“Uma relação equivalente a essa existe em siste- 
mas lineares: para o caso de sistemas em tempo con- 
tínuo, a matriz de transição de estados usa a expo- 
nencial da matriz dinâmica A do sistema, ao passo 
que para sistemas em tempo discreto, a matriz de 
transição de estado correspondente a um período de 
amostragem é a própria matriz dinâmica do sistema. 


calmente. Como N é grande, pode-se ter a 
impressão que a expectativa da evolução ex- 
ponencial de condições iniciais é frustrada. 
Para superar essa dificuldade, é fundamental 
notar que 


9FN (xo) 


de É DE(DE. (DF(29)). 


N vezes 


O fato de a matriz jacobiana produto usar 
matrizes jacobianas avaliadas ao longo da tra- 
jetória (ver eq. 5.12), e não ser o resultado de 
N aplicações do mesmo mapa, permite usar 
(5.13) para estimar os expoentes de Liapunov 
para o caso de mapas. 

Nesse sentido, a presença de ruído é um 
fator não desprezível, pois, localmente, as pe- 
quenas diferenças entre condições iniciais po- 
dem ser facilmente mascaradas por ruído. 


Exemplo 5.1.2 


Neste exemplo, a expressão (5.13) é usada 
para calcular o expoente de Liapunov para 
o mapa logístico: xp = up a(l — Xp 1). 

Como o mapa é conhecido, é fácil deter- 

minar a “matriz” jacobiana: 


OF (ae) 
dx 


= 4 — 2uip-- 


Assim, simula-se o mapa logístico 
para gerar uma sequência de iteradas ao 
longo da qual o |9F(x)/dx| é determi- 
nado (ver Eg.5.13). A fim de apreciar 
melhor como o expoente de Liapunov se 
relaciona aos regimes dinâmicos do mapa 
logístico, na Figura 5.4 é mostrado tam- 
bém o diagrama de bifurcação. 

Sabemos que uma bifurcação de ponto 
fixo está associada à mudança de sua es- 


tabilidade e que no ponto de bifurcação 
um autovalor da matriz jacobiana tem 
parte real nula. Portanto, em pontos de 
bifurcação o máximo expoente de Liapu- 
nov é nulo, como pode ser constatado na 
Figura 5.4. 


FIGURA 5.4: Diagrama de bifurcação e ex- 
poente de Liapunov. (a) Diagrama de bi- 
furcação e (b) expoente de Liapunov com- 
putado usando (5.13) para o mapa logís- 
tico. Com esperado, À = 0 nos pontos de 
bifurcação e À > 0 nos regimes caóticos 
(OLyapLogistic.m). 


Exemplo 5.1.3 


Neste exemplo, investigamos duas dife- 
renças com relação ao Exemplo 5.1.2. Em 
primeiro lugar, desejamos estimar o ex- 
poente de Liapunov sem lançar mão do 
conhecimento da equação do mapa. Em 
segundo, desejamos investigar o efeito do 
ruído. 

A fim de estimar o expoente de Lia- 
punov sem o conhecimento do mapa, pre- 
cisamos implementar a Eq. 5.9. Lembre- 
se que d- é uma pequena diferença en- 
tre dois estados. Como essa diferença 
se propaga é o que define o expoente de 
Liapunov. Portanto, é possível estimar 
À usando (5.9) seguindo os passos assu- 
mindo que se tem uma série de iteradas 
Tk, = Ze ar 


1. tomamos um subconjunto de itera- 


das que serão usadas como referên- 
cias no 2 Na sendo 
io es RE 


para cada valor em xi procura- 


mos nos dados Zp, k=Nçg,..,N 

o estado mais próximo, chamemos 

de x?. Por exemplo, digamos que 
ref 


para 779 O estado mais próximo em 
a o 
Th, k = Met, .--,N seja Tia; 


determinamos a diferença entre es- 


ses estados: dk = x) — vit, que no 


exemplo acima corresponde a d100 = 


Pp ref . 
T1345 — T100 


buscam-se as iteradas subsequen- 
5 ref p 
tes, OU seja Ty € Ty, QUE DO 


exemplo correspondem a ri e Tha16; 


a diferença entre os estados é dpy1 = 
p ref a a 
Ti — Tky1» OU Seja, no caso hipo- 


tético considerado é dj = Li346 — 
ref . 


do 

6. por fim, a razão dk+1/ôk caracteriza 
a propagação local de pequenas di- 
ferenças nos dados. Essa razão é 
por fim utilizada em (5.9) para es- 
timar o expoente de Liapunov. 


O segundo aspecto investigado no pre- 
sente exemplo foi o efeito de ruído na es- 
timativa do expoente de Liapunov. Para 
isso os dados foram gerados pelo mapa lo- 
gístico com ruído: xp = uxk-(1—xk-1)+ 
e(k), em que e(k) é uma variável aleató- 
ria branca, com distribuição gaussiana, 
média nula e desvio padrão 0.. A Fi 
gura 5.5 mostra o valor estimado de À 
para uma faixa de valores de oc. Note 
que somente para valores muito baixos 
de ruído é que se tem uma boa estima- 


tiva do expoente de Liapunov. Detalhes 
dessa implementação podem ser obtidos 
em QLyapLogistic. 


0 1 n 
10% 26" 


FIGURA 5.5: Expoente de Liapunov esti- 
mado com ruído 


O expoente foi estimado sem o conheci- 
mento do mapa, somente a partir de da- 
dos, conforme descrito no Exemplo 5.1.3. 
Note que a estimativa do expoente de Li- 
apunov é bastante sensível ao ruído nos da- 
dos. Na figura ce é o desvio padrão do ruído 
(OLyapLogistic.m). 


Nesta seção somente os conceitos princi- 
pais envolvidos na definição de expoentes de 
Liapunov foram mencionados. Há diversos 
algoritmos disponíveis para determinar tais 
expoentes a partir de modelos ou de séries 
temporais (Fiedler-Ferrara e Prado, 1994; 
Savi, 2006). 


5.2 Entropia de Atratores 


O conceito de entropia aplicado a atratores, 
sejam estranhos ou não, está intimamente re- 
lacionado ao conceito de informação. Em 
1948, Shannon definiu a quantidade de infor- 
mação de uma mensagem sobre a ocorrência 
de um evento como sendo 


= log É, 
p 


em que p é a probabilidade a priori, ou seja 
antes do recebimento da mensagem, de ter 
ocorrido o evento, e q é a probabilidade a pos- 
teriori de ocorrência do evento, ou seja após 
a chegada da mensagem. Sendo assim, q é 
influenciado pelo nível de ruído (incerteza) 
no canal de comunicação, pois na ausência 
de ruído, tem-se certeza plena do conteúdo 
da mensagem após seu recebimento e, por- 
tanto, q=1. Portanto, para caso de canais 
sem ruído tem-se 


1 
Rs es = —logp. (5.14) 


A fim de ilustrar a interpretação de (5.14) 
considere que a mensagem a ser recebida con- 
tém o resultado do lançamento de uma mo- 
eda. Se a moeda não for tendenciosa, a 
probabilidade de se ter cara é igual à de 
se ter coroa. Lançada a moeda e transmi- 
tido o resultado, do ponto de vista do re- 
ceptor, a quantidade de informação de uma 


mensagem com o conteúdo cara (ou coroa) 
é h= — log 1/2= log 2. 'Tomando-se o loga- 
ritmo na base 2, tem-se que A = 1 bit. A in- 
terpretação desse significado é que basta um 
bit para informar o resultado do evento, por 
exemplo, associando-se O ao resultado cara e 
1 ao resultado coroa. 


Nesse exemplo, nota-se que h está asso- 
ciado à complexidade do código necessário 
para descrever a informação. No exemplo, a 
quantidade de informação é de 1 bit, indi- 
cando que basta 1 bit para representar a in- 
formação a ser codificada. Se, por outro lado, 
for desejado codificar o resultado do lança- 
mento de um dado, é necessário um código 
que consiga registrar seis símbolos diferentes. 
No caso de um código binário, 2 bits não são 
suficientes, mas com 3 bits é possível repre- 
sentar 8 números distintos. Voltando à defi- 
nição (5.14), no caso de um dado não viciado 
tem-se h= — logs(1/6)=2,85 bits, que indica 


que dois bits é pouco e que 3 bits são suficien- 
tes para codificar o resultado do lançamento 
de um dado. 

No caso de haver N resultados, por exem- 
plo lançamentos de moeda e de dados, cada 
um com probabilidade p; e quantidade de 
informação h;, a entropia informacional de 
uma mensagem enviada por um canal sem 
ruído é definida como 


N N 
H=5 pih;=-—> pilogop; (5.15) 
j=1 j=1 


que pode ser interpretada como a esperança 
matemática (ou o valor médio) de h consi- 
deradas as N possibilidades. A entropia de 
Kolmogorov-Sinai (KS) é definida por 


1 

K=- lim lim lim — iccia)np(ia-.cia), (5.16 

Jim lim lim a p(iy..cia)lnp(is cia), (5.16) 
fia, 


em que p(iy...ia) é a probabilidade de ob- 
servar o sistema na caixa (ver Figura 5.6a) 


ày no instante t = O, na caixa à, no ins- 
tante t=7 e assim sucessivamente. Para sis- 
temas em tempo discreto 7 = 1, e corres- 
ponde ao intevalo de amostragem normali- 
zado. Comparando-se as equações (5.15) e 
(5.16), K pode ser interpretada como a taxa 
média de criação de informação no sistema o 
que equivale à taxa média de perda de infor- 
mação por parte do observador. 


A entropia KS, K, está associada à di 
ficuldade de predizer, baseado na sequência 
de caixas à ...ia — ou seja, baseado na in- 
formação disponivel na história contida no 
intervalo O<t<ar — em que caixa %q+1 O sis- 
tema estará no instante t=(a+1)r 


(b) 


ps 
LA 


FIGURA 5.6: Trajetória no espaço de fase. Na 
definição da entropia de Kolmogorov-Sinai (a), 
imagina-se uma trajetória no espaço de fase co- 
berta com cubos de aresta e. Um procedimento 
semelhante é seguido na definição de entropia de 
Boltzmann (b). 


5.2.1 Relação com os expoentes 
de Liapunov 


A definição de Boltzmann para entropia é 
ID = Togo N, (5.17) 


em que N é o número de subdivisões e 1(D, é 
o número de especificações necessárias para 


localizar o sistema em uma das N subdivi- 
sões (ver Figura 5.6b). Lembre-se que no 
caso da moeda, o número de possibilidades 
(subdivisões) é 2. Nesse caso IW=1, indi- 
cando que, como visto anteriormente, basta 
um bit para descrever o resultado o lança- 
mento da moeda. No caso de um evento que 
tenha quatro possibilidades são necessários 2 
bits (log, 4) para especificar o resultado. Por- 
tanto, percebe-se que entropia e informação 
estão intimamente relacionados. 

Considere a Figura 5.6b em que é mos- 
trado um trecho de uma trajetória de um sis- 
tema dinâmico. Pela figura percebe-se que 


Meda NE E N= DE (5.18) 


em que x € IR” é o vetor de estado. See > 0, 
a(t) > a(0) e a evolução do sistema pode ser 
aproximada, localmente, por x(t)=x(0)e!t, e 


Agi(t) — Azi, i=1,...,n, (5.19) 


para cada componente do vetor de estado. 
Substituindo (5.19) em (5.18) e o resultado 
em (5.17) chega-se a? 


A i Ait 
o = logo Sono e , 


art) clog,e  Azx;(0)e! 
: = Ai = Ai l , 
dt É Axi(0)eMit e Ai loga é 
x Asi=1,...,n, (5.20) 


ou seja, a variação de entropia (ou informa- 
ção) é proporcional aos expoentes de Liapu- 
nov. Se um sistema tiver um expoente de Li- 
apunov positivo, em uma direção no espaço 
de fases, esse sistema cria informação. Do 
ponto de vista do receptor, isso significa que 
ele perde informação à medida que observa 
o sistema. Na prática, tal produção de in- 
formação limita a capacidade de se predizer 


“No a desenvolamento será, usado: 


d 
ar loga, E a = logo a. 


o sistema baseado no passado. Essa é outra 
maneira de interpretar a sensibilidade a con- 
dições iniciais, resultante do sistema possuir 
pelo menos um expoente de Liapunov posi- 
tivo, como visto na seção 5.1. 


Exemplo 5.2.1 


A Figura 5.7 mostra a entropia informa- 
cional H para iteradas do mapa logístico 
para 2,9<y<4. 


2.8 3 3.2 3.4 3.6 3.8 4 


FIGURA 5.7: Entropia informacional do 
mapa logístico. O valor de H em (5.15) de- 
pende de N no regime caótico. O resultado 
mostrado em traço contínuo foi obtido para 
N=50 e no caso do tracejado para N=100. 


Até u=3 o regime é periódico com pe- 
ríodo 1, portanto não há qualquer “infor- 
mação”. Em |=3 o ponto periódico sofre 


uma bifurcação flip e a sequência de ite- 
radas passa a alternar entre dois valores, 
portanto, um bit é suficiente para indi- 
car essa situação, pois basta atribuir um 
símbolo para um valor e outro símbolo 
para o outro. Quando os pontos periódi- 
cos de F() passam por uma bifurcação 
flip para ju acima de 3,4, a sequência de 
iteradas passa a alternar entre quatro va- 
lores diferentes e, portanto, dois bits são 
necessários e suficientes para caracterizar 
essa condição. 

No regime caótico, quanto mais re- 
sultados (valor de N) forem permitidos, 
tanto maior é a entropia informacional, 
pois a complexidade do resultado fica mais 
evidenciada. Assim, H não serve como 
medida “absoluta” de complexidade, ou 
de informação, mas é útil, por exemplo, 
para comparar duas situações ou dois sis- 
temas. 


5.2.2 Estimativa usando 
símbolos 


Nesta seção é apresentado um procedimento 
de estimativa da entropia de Shanon usando 
símbolos. Para fins ilustrativos são usados 
dados sobre o atrator de Róssler no modo es- 
piral de maneira a utilizar somente dois sím- 
bolos. 


Considere o mapa de primeiro retorno hi- 
potético mostrado na Figura 5.8. Trata-se de 
um mapa unimodal em que o ponto de má- 
ximo foi indicado com a letra c. Toda iterada 
do mapa que tiver abcissa menor que a cor- 
respondente a c recebe o símbolo 0, sendo que 
as demais recebem o símbolo 1. Assim, uma 
série de iteradas do mapa pode ser univoca- 
mente transformada em uma série de símbo- 
los “0” e “1'. A maneira com que esses sím- 
bolos se alternam corresponde à dinâmica do 
mapa. Esse tipo de análise é conhecido como 


dinâmica simbólica. 


Ainda com respeito à Figura 5.8, note que 
o símbolo O corresponde a comportamento di- 
nâmico que não inverte a direção relativa dos 
segmentos domínio (a—b) e imagem (A-—B), 
pois ambos ocorrem na direção de aumento 
da variável x. No caso do símbolo 1, a di- 
reção relativa de a—b e A-B está invertida, 
pois para um “aumento” no domínio, o mapa 
inverte a relação transformado-a em uma “di- 
minuição” na imagem A-—B. Assim, os sím- 
bolos representam ações dinâmicas diferen- 
tes. 


Tk+1 Tk+1 


FIGURA 5.8: Atribuição de símbolos. O ramo 
de subida, até o ponto crítico c, recebe o sím- 
bolo 0, ao passo que o ramo de descido, o sím- 
bolo 1, que está associado a uma reversão da 
direção do segmento imagem A-B. 


No caso de o mapa ser multimodal, ou 
seja, ter mais de um ponto crítico (ponto de 
máximo ou mínimo) para cada braço do para 
atribui-se um símbolo: ramos de subida são 
pares e ramos de descida ímpares. Logo, o 
número de símbolos usados, chamado de al- 
fabeto, reflete a complexidade do mapa de 
primeiro retorno. 


Em se tratando de fluxos, a atribuição de 
símbolos é feita por ciclo. Define-se uma se- 
ção de Poincaré P e obtém-se o mapa de pri- 
meiro retorno correspondente, à semelhança 
do que foi feito para o sistema de Róssler. A 
partir daí a sequência de passos é equivalente, 
ou seja, define-se um (ou mais) valor(es) crí- 
tico c que particiona(m) o espaço de estados 
— a escolha do valor máximo ou mínimo é co- 
mum, mas não é a única, especialmente se o 
mapa de primeiro retorno não for bem defi- 
nido. Ciclos que passem em P de um lado de 
c recebem um símbolo, e os que passam do 
outro lado, recebem o outro símbolo. Nesta 
discussão assume-se que o mapa é unimodal 


2 


e, portanto, um par de símbolos é suficiente. 


A Figura 5.9 mostra um conjunto de ci- 
clos sobre o atrator de Róssler. Todos os ci- 
clos têm duração de seis segundos. Como o 
regime dinâmico é caótico, o tempo necessá- 
rio para voltar à seção de Poincaré P varia. 


Apesar disso, a variação é pequena, o que ca- 
racteriza um regime de fase coerente, assunto 
tratado no Capítulo 10. Cada ciclo indicado 
na figura tem início em P. Se a coordenada 
y sobre essa seção, o que indicamos por yp, 
estiver à esquerda do valor crítico, ou seja, 
se yp>c, o ciclo recebe o símbolo O e é in- 
dicado em preto. Caso contrário, recebe o 
símbolo 1 e é indicado em vermelho. Por- 
tanto, após esse procedimento, os ciclos so- 
bre o atrator podem ser substituídos por uma 
sequência de zeros e uns. Essa sequência co- 
difica a dinâmica do atrator. A Figura 5.9 
revela alguns aspectos interessantes. Primei- 
ramente, assim como ocorre com o mapa (ver 
Figura 5.8), o símbolo 1 está associado a uma 
inversão, que pode ser vista ao perceber que 
um ciclo que comece em 'P do lado externo do 
atrator, é reinjetado na parte interna. Além 
disso os ciclos em vermelho “sobem por trás 
do atrator, sofrem inversão, e são re-injetados 


sobre a parte baixa do atrator”. 


Outro ponto interessante é perceber que 
nesse atrator um ciclo O nunca é seguido por 
outro ciclo O, ao passo que ciclos 1 podem 
tanto ser seguidos por ciclos 0 ou ciclos 1. As- 
sim, à sequência de símbolos reflete o padrão 
de oscilação ou sequências permitidas e não 
permitidas dos ciclos do atrator. Deve ser 
notado que a sequência simbólica é bastante 
robusta a ruído, pois este tipicamente não 
altera os símbolos, a menos de ciclos muito 
próximos a c. Por outro lado, a escolha de c é 
um pouco dificultada por ruído, mas mesmo 
assim, a sequência de símbolos é bem mais 
robusta que as séries temporais. 


FIGURA 5.9: Símbolos no atrator de Róssler es- 
piral (a=0,398). Cada ciclo é mostrado por seis 
segundos a partir do momento que passa pela 
seção de Poincaré, que toca o ponto fixo central. 
Neste caso o ponto crítico é c=—3,16. Valores 
tais que yp>c recebem o símbolo 0 e são indi- 
cados em cor preta. Ciclos em vermelho são os 
que recebem o símbolo 1. 


O atrator mostrado na Figura 5.10 foi ob- 
tido para o parâmetro a=0,42, sendo que os 
demais parâmetros permanecem inalterados. 


O regime caótico da Figura 5.10 é mais de- 
senvolvido que aquele da Figura 5.9. Uma 
das características que revela isso é o fato 
de a órbita em torno do ponto fixo central 
estar mais próxima dele. O mapa de pri- 
meiro retorno do atrator da Figura 5.10 — 
não mostrado — é uma parábola com pernas 
mais longas. Contudo, ainda é um mapa com 
um único ponto crítico, de modo que a diná- 
mica pode ser aproximada usando somente 
dois símbolos. 


FIGURA 5.10: Símbolos no atrator de Róss- 
ler espiral (a=0,42) Neste caso o ponto crítico é 
c=-83,24. Valores tais que yp>c recebem o sím- 
bolo 0 e são indicados em cor preta. Ciclos em 
vermelho são os que recebem o símbolo 1. 


Assim como feito anteriormente, os tre- 
chos de órbitas com seis segundos de dura- 
ção que na seção de Poincaré P passam à 
esquerda do ponto crítico, ou seja que aten- 
dem à condição yp>c, recebem o símbolo O e 
são mostrados em preto. Os demais trechos 


são mostrados em vermelho. Ao contrário do 
que ocorre com o atrator da Figura 5.9, agora 
um símbolo O pode ser seguido de um outro 
símbolo 0. Isso resulta em um menor número 
de “palavras não usadas”, o que corresponde 
a uma dinâmica mais complexa. 


Após transformar uma trajetória sobre o 
atrator em uma sequência de símbolos, neste 
caso uma sequência de Os e 1s, são definidas 
palavras de comprimento q e contado o nú- 
mero de ocorrências dessas palavras na sequên- 
cia simbólica em estudo. Para fins de argu- 
mentação, suponha que q=2. Nesse caso as 
palavras possíveis são: 00, 01, 10 e 11. 


No caso da Figura 5.9, como visto, um 
símbolo 0 não ocorre logo após um outro 
O. Portanto a primeira palavra, ou seja, 00 
não ocorre no “dicionário”. Não somente isso, 
a palavra 10 não pode ser seguida da pala- 
vra 01, pois isso implicaria haver a sequência 
:.. 1001... ao longo da trajetória, o que não 


ocorre para esse atrator. Isso ilustra que a 
ocorrência das palavras de símbolos está in- 
timamente relacionada ao padrão dinâmico. 


Retornemos à formação do dicionário. A 
sequência de símbolos é dividida em palavras 
de comprimento q sem superposição. Para 
q=? no contexto de uma alfabeto com dois 
símbolos temos somente 224 palavras pos- 
síveis. Chamemos 00 a palavra 1, 01 a pala- 
vra 2, 10 a palavra 3 e 11 a quarta palavra. 
Um histograma mostra a ocorrência dessas 
palavras em uma trajetória sobre o atrator 
(Fig. 5.11). Note que para o caso a=(,398 
não há ocorrências da palavra 00, como an- 
tevisto, ao passo que para a=(),42 a proba- 
bilidade de ocorrer essa palavra é por volta 
de 0,12. A maior complexidade da dinâmica 
para o caso a = 0,42 é refletida pela ocorrên- 
cia de um maior número de palavras — todas, 
neste simples caso. 
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FIGURA 5.11: Probabilidade de ocorrên- 
cia de palavras no atrator de Róssler espiral 
(a) a=0,398; (b) a=0,42. Aqui as palavras são 
formadas por apenas q=2 símbolos. A palavra 
zero é 00 e a palavra três é 11. 


Na prática palavras de dois símbolos são 
muito curtas para realizar uma análise e valo- 
res entre 4 e 6 são os mais comumente utiliza- 
dos. Repetindo o procedimento acima, mas 
considerando palavras com cinco g=5 bits, 
chega-se aos histogramas mostrados na Fi- 
gura 5.12. Uma vez mais, a maior ocorrên- 
cia de palavras diferentes para a=0,42 con- 
firma que se trata de um regime dinâmico 
mais complexo. 

Por fim, calceulamos a entropia a partir 
dos histogramas adaptando (5.15) para o pre- 
sente caso: 


241 


H;=— > pylogop;, (5.21) 
9=0 


em que p; é a probabilidade de ocorrência da 
jésima palavra, conforme indicado pelos his- 
togramas. Para a=0,398 obtém-se H=3,16, 
ao passo que para a=(,42 tem-se H=4,02. 
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FIGURA 5.12: Probabilidade de ocorrên- 
cia de palavras no atrator de Róssler espiral 
(a) a=0,398; (b) a=0,42. Aqui as palavras são 
formadas por q=5 símbolos. A palavra zero é 
00000 e a palavra 2º-1=31 é 11111. 


Como curiosidade observa-se que a pri- 
meira palavra 00000 não ocorre em nenhum 
dos casos mostrados na Figura 5.12, mas a 
palavra 11111 — que é a palavra 431 — ocorre 
para o atrator com a=0,398, mas não para 
a=0,42. 


5.3 Dimensão de Atratores 


Em meados do século 20, Benoit Mandelbrot 
procurava respostas a perguntas tais como 
quanto mede a costa de uma ilha? Se tomar- 
mos um mapa e uma régua e nos lançarmos 
à tediosa tarefa de determinar a extensão de 
uma costa, depois de algum esforço chega- 
ríamos a um determinado resultado. Ima- 
gine, ainda que, insatisfeitos com a falta de 
resolução escolhamos um outro mapa, mas 
com uma escala maior, o que nos permitiria 
calcular a extensão da costa mais detalha- 
damente. Como se compararia o novo resul- 


tado ao primeiro? Certamente seria um valor 
maior. Em qual confiar? Para evitar favo- 
ritismos, resolvemos tomar um mapa maior 
ainda e repetir o tedioso procedimento. Ao 
fim da terceira maratona geodésica, chegare- 
mos à um novo resultado, maior ainda que os 
dois anteriores. Logo percebemos que o re- 
sultado cresceria indefinidamente, e a razão 
para isso é o caráter “enrugado” da costa. 


Objetos fractais, assim como a linha cos- 
teira em um mapa, também têm linhas e su- 
perfícies rugosas. Como medi-los? Se repe- 
tirmos um procedimento semelhante ao feito 
com o mapa, conforme descrito no parágrafo 
anterior, perceberemos que, ainda que o com- 
primento cresça indefinidamente à medida que 
aumentarmos a resolução, a razão entre o 
comprimento e a resolução convergem para 
uma relação bem definida. Essa relação é 
caracterizada por um parâmetro ao qual se 
confere o conceito de dimensão. Alguns con- 


ceitos relacionados são abordados nesta se- 
ção. 

Em 1958 Kolmogorov definiu a dimensão 
de contagem de caixas de um objeto A como 


mo. (5.22) 


em que N(e) é o número de cubos de aresta 
e necessário para cobrir o objeto 4. A ideia 
por trás de (5.22) — também conhecida como 
dimensão de capacidade — é discutida a se- 
guir. 

Ao diminuir a unidade de medida e — isso 
corresponde a aumentar a resolução com que 
procura cobrir o objeto — é natural que o nú- 
mero de caixas que contenham partes do ob- 
jeto A aumente, assim como aumenta o com- 
primento da costa toda vez que se utilizava 
um mapa com maior nível de detalhes. En- 
tretanto, mesmo que o número de caixas au- 
mente indefinidamente à medida que e > 0, 


é possível que a razão em (5.22) convirja. Se 
isso acontecer, o valor para o qual convergir, 
Do, é chamado de dimensão de contagem de 
caixas. Isso é ilustrado no próximo exemplo. 


Exemplo 5.3.1 


Seja um segmento de reta de comprimento 
L. Deseja-se cobrir essa reta com caixas 
de aresta e e contar quantas caixas são 
necessárias para cobrir toda a reta. Se 
as caixas forem do tamanho do segmento 
de reta, ou seja, se e = L, somente é 
necessário utilizar uma caixa, portanto, 
N(L) = 1. Ao reduzir o tamanho da 
aresta da caixa pela metade, são neces- 
sárias duas caixas, ou seja N(L/2) = 2. 
Neste caso simples, está claro que a re- 
lação geral é N(L/n) = ne e = L/n. 


Portanto, usando (5.22) tem-se 


los N(L ] 
Dn cedo 


[a 1 
n>00 logn — log L | n5% logn 


conforme esperado para uma reta. Note 
que no limite n — oo o termo log L torna- 
se desprezível comparado com log n. 

Procedendo da mesma maneira com 
um quadrado de aresta L, nota-se que 
para e = L, tem-se N(L) = 1. Entre 
tanto, se e = L/2, o número de caixas 
necessário para cobrir o quadrado é agora 
N(L/2) = 4. Assim, para o caso geral de 
e = L/n, o número necessário de caixas 
é N(L/n) = nº. Portanto 


log N(L log n? 
o a a a 
n>o logn — log L | n5o logn 


) 


como esperado. 


A dimensão D,, apesar de ser conceitual- 
mente simples, é muito custosa de ser com- 
putada numericamente, especialmente para 
objetos de dimensão maior que dois, ou seja, 
dim[A| > 2. Por outro lado, uma das vanta- 
gens de Dy é ser aplicável a objetos do tipo 
conjuntos de Cantor, que são figuras geomé- 
tricas em que não existe o conceito de corre- 
lação temporal entre valores vizinhos. 


No caso de “objetos dinâmicos”, como por 
exemplo atratores no espaço de estados, va- 
lores subsequentes ao longo de uma trajetó- 
ria, no tempo, estão correlacionados tempo- 
ralmente. Essa característica permite fazer 
uso de novas definições que são mais fáceis de 
calcular, em particular, a dimensão de corre- 
lação. Antes de definir essa dimensão, define- 


se à dimensão de informação D, como sendo 


D lim —— 
É O log 1/e 


O nome dimensão de informação origina-se 
no fato de que H é a entropia informacional 
de Shannon, definida em (5.15). A dimensão 
de correlação Ds, ou D, é definida como 


(524) 


em que f; é a frequência relativa” com que 
dois pontos de um atrator caem na j-ésima 
partição do espaço (caixa). Na seção 5.3.1 é 
apresentado um algoritmo comumente usado 


No limite em que há infitos dados e que a dimen- 
são das partições aproxima-se de zero, a frequência 
relativa torna-se a probabilidade. 


para estimar a dimensão de correlação defi- 
nida em (5.24). 

Uma outra medida de dimensão, agora 
baseada em expoentes de Liapunov, já ha- 
via sido proposta por Kaplan e Yorke, em 
1978. Considere um atrator em um espaço de 
dimensão de. Tal atrator tem, portanto, de 
expoentes de Liapunov, que podem ser orde- 
nados de maneira decrescente Ai, À», ..., Ago 
Primeiramente, é necessário encontrar o maior 
9 tal que 


) 
DE AO (5.25) 
t= 


A dimensão de Kaplan e Yorke é definida 
como 


l 
Dey=)+tr— Aljs 9.26 
Ky =) Ra] pa j ( ) 


Por exemplo, a dimensão de Kaplan e Yorke 


de um mapa caótico dissipativo de dimen- 
são 2 (hM >0,hh<0ech+hÃo<õ0)é 


Os proponentes da definição (5.26) con- 
jecturaram que Dxy serve como limite infe- 
rior à dimensão de contagem de caixas, ou 
seja, Dey < Do, o que é conhecido como a 
conjectura de Kaplan e Yorke. 

É natural perguntar-se qual é a relação 
entre as diversas medidas de dimensão (frac- 
tal) mencionadas nesta seção. Na prática, 
as diversas estimativas são muito próximas e 
chegam a ser indistinguíveis, quando se leva 
em consideração a incerteza de medição e a 
incerteza dos cálculos numéricos. Contudo, 
em teoria, é possível argumentar em favor da 
seguinte relação: 


Do, < Di, < Dey < Do, (5.27) 


sendo que as igualdades ocorrem no caso de 
atratores homogêneos. 


5.3.1 O algoritmo de Grassber- 
ger e Procaccia 


Em 1983, Grassberger e Procaccia sugeriram 
aproximar f; em (5.24) pela frequência rela- 
tiva com que dois pontos estão separados por 
uma distância menor ou igual a e. Seja 


N 
1 
t)=5 5 Ae; |) (5.28) 
k=1 
em que N é o número de vetores disponíveisº 
a função O(x), chamada de degrau de Hea- 
viside, é definida como 


1 sex >0 
ot) =[ O sex <o0. (5.29) 


êNa maioria dos problemas de interesse neste li- 
vro, tais vetores são “pontos” no espaço de estado ou 
b) 
no espaço de imersão (ver Capítulo 6). 


Portanto, q;(e) é a fração de pontos (no es- 
paço de imersão) que estão a uma distância 
menor que e do ponto x;. Calculando-se q;(e) 
para cada ponto disponível e somando-se to- 
dos os valores obtidos resulta em 


N 


cd) = + DD ud (530) 


j=1; 97% 


que é chamada de função de correlação ou, 
ainda, integral de correlação. 

Na prática, não é necessário calcular q;(e€) 
para todos os pontos disponíveis. Uma al- 
ternativa, computacionalmente mais conve- 
niente, é selecionar um subconjunto de pon- 
tos €., c= 1,2,...,N', Nº « N, chamados 
centros. Assim, a integral de correlação pode 
ser aproximada por 


em que qe(e) são calculados apenas nos cen- 
tros. Por fim, o estimador da dimensão de 
correlação proposto por Grassberger e Pro- 
caccia é dado por 


l 
D, = lim (im EE 


N50 Le50 loge 


) , (5.39) 


em que C(e) é determinado por (5.31). Por- 
tanto, respeitando-se os limites, que apare- 
cem em (5.32), a dimensão de correlação é es- 
timada como a inclinação do gráfico log C'(e) x 
log e. 

Ao longo dos anos, o estimador de Grass- 
berger e Procaccia sofreu diversas (pequenas) 
modificações. Uma delas, proposta por Thei- 
ler em 1986, que se torna relevante quando N 
não for suficientemente grande,” é motivada 
pela seguinte observação. Idealmente, ape- 
nas os pontos espacialmente correlacionados 


"Na Sec. 5.4 é discutido o assunto do tamanho re- 
querido para a série de dados. 


é que deverm determinar D,. Entretanto, 
trechos contíguos em uma série temporal, por 
exemplo (x1,%2,%3,%4) € (12, %3,%4, X5), pro- 
vavelmente* são vizinhos no espaço, neste 
exemplo de dimensão 4. A proximidade es- 
pacial, nesse caso, foi induzida pela proxi- 
midade temporal e, por isso, é espúria em 
termos do cálculo de Do. A solução pro- 
posta por Theiler consiste de somente levar 
em conta os pares de pontos que, no tempo, 
estão separados por uma distância mínima 
W, em que W é um número inteiro de atra- 
sos de tempo, que é um dos parâmetros na 
técnica de imersão utilizando coordenadas de 
atraso, conforme visto no Capítulo 6. O com- 
primento da janela de Theiler, W, é esco- 
lhido de tal maneira que os pontos usados 
no cálculo de Ds não estejam temporalmente 
correlacionados, ainda que sejam vizinhos no 
espaço (Theiler, 1986). 


“Dependendo do tamanho de e. 


Algumas das principais características 
envolvendo expoentes de Liapunov, entropia 
e dimensão fractal estão resumidas na Ta- 


bela 5.1. 


Tabela 5.1: Relação de regimes dinâmicos e 
estocástico com, expoentes de Liapunov, en- 
tropia KS e dimensão fractal. n é a dimen- 
são do espaço. D é a dimensão da solução 
assintótica (Fiedler-Ferrara e Prado, 1994, 


p. 155). 
Regime expoentes entropia KS dimensão fractal 
de Liapunov 
regular AA; >0 K =0 D<neDElIN 
caótico IA >0 O<K<DM,>o AM D<neDEIR 
estocástico o K 5 o | D=n 


5.4 Características 
dos Dados 


O presente capítulo trata da caracterização 
de atratores. Nesse contexto, foram apresen- 
tados os expoentes de Liapunov, medidas de 
entropia e de dimensão fractal. Existem al- 
goritmos numéricos que estimam essas gran- 
dezas, normalmente a partir de dados. É na- 
tural perguntar-se quais são as característi- 
cas que os dados precisam ter para que as 
referidas grandezas sejam bem estimadas. 
Antes de discutir propriamente sobre al- 
gumas características, é útil mencioná-las: 
tempo de atraso, comprimento, estacionarie- 
dade, presença de ruído e escolha da variável 
observada. Na sequência, cada uma dessas 
características é brevemente mencionada. 
Tempo de atraso. A escolha do tempo de 
atraso, 7, é discutida com mais detalhe no 
Capítulo 6. Por agora basta chamar atenção 


para o fato de que o tempo de atraso é dife- 
rente do período de amostragem T.. Este tem 
a ver com o registro em tempo discreto de 
uma grandeza contínua no tempo, ao passo 
que o tempo de atraso está associado à re- 
presentação de um sinal no espaço de recons- 
trução. A escolha adequada de ambos é im- 
portante para se ter uma boa reconstrução. 
Tipicamente, o tempo de atraso é maior que 
o período de amostragem. 


Comprimento da sequência de dados. 
Com relação ao comprimento dos dados, é 
necessário observar que várias definições su- 
põem que o registro de dados é infinito, como 
no caso de expoentes de Liapunov para flu- 
xos (ver Eq. 5.7), para mapas (ver Eq. 5.13) 
e entropia KS (ver Eq. 5.16). Nas definições 
acima mencionadas, o fato de o comprimento 
de registro de dados ser infinito aparece de 
maneira explícita. Essa necessidade origina- 
se na teoria de ergodicidade que permite que 


a medida de um atrator seja obtida por meio 
de médias temporais em vez de se tomar mé- 
dias amostrais que, no caso dinâmico, corres- 
ponderiam a médias “síncronas” de infinitas 
realizações. Ou ainda, esse procedimento é 
uma maneira numérica de estimar a proba- 
bilidade do sistema se encontrar em um de- 
terminado ponto do atrator. 


Na prática, entretanto, o registro de da- 
dos utilizado é finito e a consideração N — 
oo deve ser interpretada como uma indica- 
ção que a série temporal em questão deve 
ser “suficientemente longa”. Não há resulta- 
dos conclusivos que determinem o valor mí- 
nimo de N necessário para se ter uma boa 
estimativa dos índices mencionados anterior- 
mente. Além disso, a necessidade de dados 
varia muito de um algoritmo para outro. Uma 
das áreas de investigação em dinâmica não li- 
near é o desenvolvimento de algoritmos que 
necessitem sequências de dados mais curtas 


para estimar, com a mesma qualidade, gran- 
dezas que caracterizem o atrator. 


Com relação às definições de dimensão, 
que por alguns anos foram mais utilizadas 
para caracterizar atratores que os expoentes 
de Liapunov e a entropia KS, a quantidade 
de dados não aparece explicitamente nas de- 
finições. Para efeito de discussão, utiliza-se a 
dimensão de correlação, definida em (5.24). 
A discussão permanece válida para as demais 
definições de dimensão apresentadas na Se- 
ção 5.3, após os devidos ajustes. 


Imagine uma série temporal de tamanho 
finito imersa em um espaço de dimensão d.. 
A fim de calcular a dimensão de correlação, 
é necessário calcular a probabilidade de dois 
pontos quaisquer sobre o atrator estarem den- 
tro de uma mesma vizinhança (hiper-esférica 
de dimensão de) de raio e. Deve ser notado 
que nas definições de dimensão (Do, D, e 
D») apresentadas na Seção 5.3, e > 0. À 


medida que o tamanho da vizinhança dimi- 
nui, à probabilidade de encontrar dois pontos 
na mesma vizinhança tende a zero, a menos 
que o tamanho da série temporal tenda a in- 
finito. Portanto, do ponto de vista da ne- 
cessidade de dados, o limite e > O equivale a 
N 5 00. Deve ser notado que o mesmo pode 
ser argumentado à medida que de aumenta 
(ver Exercício 5.4), que é um problema con- 
creto, pois na prática a dimensão é calculada 
para valores crescentes de de, até observar-se 
saturação. 

No caso da estimativa de dimensão, al- 
guns trabalhos apontam para diretrizes que 
servem de referência para o tamanho do re- 
gistro de dados necessário. Em particular, 
David Ruelle (1990) argumentou que uma 
sequência de dados de comprimento N e o 
máximo valor de dimensão estimável de ma- 
neira consistente estão relacionados por” 


“A expressão (5.33) foi defendida por Ruelle, mas 


Dimax < 2l10g1p N. (5.33) 


O sinal < na expressão (5.33) confere 
um certo grau de subjetivismo ao resultado. 
Mesmo assim, (5.33) pode ser útil para se 
ter uma referência, a posteriori, da confiança 
que pode ser atribuída a uma estimativa de 
dimensão. Por exemplo, se uma série tem- 
poral tem 1000 valores, 210g1, N = 6 e, por- 
tanto, espera-se que Dmax < 6. À questão é, 
quanto é muito menor que 6? Uma resposta 
igualmente subjetiva é: menos que a metade, 
ou seja, Dmax < logiy N. Assim, a expressão 
(5.33) sugere cautela no uso e interpretação 
de uma estimativa de dimensão igual a 3 ou 
superior feita a partir de uma série temporal 
com N da ordem de poucos milhares. 


sua validade também foi criticada por outros autores 
(Essex e Nerenberg, 1991). 


Um exemplo disponível na literatura for- 
nece uma estimativa D, = 9,2 como a di- 
mensão de correlação de um suposto atrator. 
Seguindo a diretriz indicada em (5.33), esse 
resultado demandaria uma série temporal da 
ordem de N = 10º valores. Contudo, a série 
utilizada para estimar Do» tinha pouco mais 
que 3,6 x 10º valores, mas devido à não es- 
tacionariedade inerente (ver próximo item), 
trechos muito mais curtos que o ideal foram 
utilizados para estimar a dimensão. Em fun- 
ção dessas observações, possivelmente a es- 
timativa relatada não seja digna de grande 
confiança. Esses valores dizem respeito a re- 
sultados publicados por terceiros utilizando 
uma série de eletroencefalograma (EEG) co- 
letada a 128 Hz, por 8 horas. 


Estacionariedade. Uma suposição funda- 
mental nas definições tanto de expoentes de 
Liapunov, entropia KS, quanto de dimensão 
fractal é que todos os dados utilizados devem 


estar sobre o mesmo atrator. Isso significa 
que a série temporal deve ser estacionária, 
o que frequentemente não ocorre em situa- 
ções práticas. Por exemplo, no caso do si- 
nal de EEG mencionado anteriormente, cer- 
tamente o sinal não pode ser considerado es- 
tacionário durante as oito horas de duração 
do experimento. Assim, o resultado divul- 
gado D, = 9,2, para o estágio REM (rapid 
eye movement) é duplamente incerto: a série 
completa não é estacionária e as subjanelas 
que poderiam ser consideradas aproximada- 


mente estacionárias são muito mais curtas do 
que N = 10º. 


Presença de ruído. Notar que o ruído 
sempre aparece como um limite inferior para 
a vizinhança e. Em toda definição que exija 
e > 0, a presença de ruído necessariamente 
contraria a definição e, portanto, os resulta- 
dos devem ser interpretados com cuidado. 


Escolha da variável observada. Como 


apresentado na Seção 6.1, o Teorema de 
Takens-Mané não faz restrições sobre a fun- 
ção de medição, desde que seja genérica. 
Contudo, como na prática as séries de dados 
utilizadas para caracterizar atratores são fini- 
tas e possivelmente ruidosas, a escolha da va- 
riável observada pode fazer grande diferença, 
como discutido na Seção 5.2. A teoria de ob- 
servabilidade fornece elementos que sugerem, 
ainda que não conclusivamente, como esco- 
lher tal variável, no caso em que mais de uma 
alternativa existe. Registra-se aqui apenas o 
fato de que a escolha da variável observada 
pode ser crítica em algumas situações práti- 
cas. O Capítulo 7 discute esse problema com 
mais detalhes. 


A maioria das discussões desta seção são 
reconhecidamente subjetivas. Além disso, os 
novos algoritmos tendem a requerer menos 
dados que os algoritmos pioneiros e, além 
disso, muitas vezes são mais robustos a as- 


pectos tais como ruído e não estacionarie- 
dade. A caracterização de atratores a partir 
de séries temporais reais ainda é uma arte, 
mais que uma ciência. Por outro lado, é 
inegável que grandes avanços vêm sendo al- 
cançados e que algumas das ferramentas dis- 
cutidas no presente capítulo têm valor prá- 
tico. No momento, a conclusão mais equili- 
brada parece ser que, ao abordar o problema 
de caracterização de atratores, diversos ín- 
dices devam ser calculados de maneira a se 
ter um cenário mais variado. Além disso, a 
confiança que pode ser realisticamente atri- 
buída às estimativas depende do algoritmo 
utilizado e da qualidade dos dados disponí- 
veis. Essa qualidade, por sua vez, é forte- 
mente determinada pelo comprimento do re- 
gistro de dados, pela estacionariedade e pelo 
ruído presente. Além da qualidade dos da- 
dos, existe o problema da qualidade da imer- 
são (ver Capítulo 6), que é determinada pela 


escolha da variável a ser medida e pelos parâ- 
metros de imersão: a dimensão d. e o atraso 
de tempo 7. 

No Capítulo 6 uma série de ferramentas 
úteis à caracterização de séries temporais são 
mencionadas. Elas devem ser consideradas 
complementares às ferramentas apresentadas 
no presente capítulo. 


Leitura Recomendada 


Outras abordagens introdutórias do pro- 
blema de caracterização de atratores po- 
dem ser encontradas em livros correlatos 
(Moon, 1987; Fiedler-Ferrara e Prado, 1994; 
Monteiro, 2002), sendo que o livro por 
Fiedler-Ferrara e Prado aborda a caracteri- 
zação de atratores de maneira mais prática, 
detalhando os alguns dos algoritmos bási- 
cos. Pseudo-códigos de algoritmos, discuti- 
dos neste capítulo, podem ser encontrados 


em (Parker e Chua, 1989). 


A relação entre as diversas estimativas 
de dimensão fractal, e em particular o resul- 
tado (5.33), foi investigada por diversos au- 
tores (Kaplan e Yorke, 1979; Farmer et al., 
1983; Grassberger, 1986; Argyris et al., 1991) 
e a relação (5.33) foi proposta em (Ruelle, 
1990). 


Uma maneira de contornar problemas prá- 
ticos relacionados ao comprimento, estacio- 
nariedade e ruído nos dados foi discutida em 
(Aguirre e Billings, 1995c). A ideia central 
é construir um modelo matemático a partir 
de uma janela relativamente curta de dados. 
Isso geralmente contorna o problema de es- 
tacionariedade. As técnicas de identificação 
de sistemas para a estimação dos parâmetros 
do modelo são bastante robustas a ruído. Por 
fim, o modelo estimado pode ser usado para 
gerar sequências de dados tão longas quanto 
necessário que, por definição, são estacioná- 


rias e sem ruído, mas que pode ser diferente 
da dinâmica subjacente aos dados originais. 
Índices como os discutidos neste capítulo po- 
dem então ser estimados a partir desses da- 
dos sintéticos. Como pode ser esperado a 
qualidade desses índices depende da validade 
do modelo estimado. O problema da identi- 
ficação de modelos a partir de dados e de sua 
validação dinâmica é tratada no Capítulo 9 e 
em referências indicadas nesse capítulo, den- 
tre as quais menciona-se (Aguirre e Billings, 
1994; Aguirre et al., 2006). 


Exercícios 


5.1. No Exemplo 5.1.1, mostre que apesar 
de as trajetórias ao longo do tempo diver- 
girem em função da extrema sensibilidade a 
condições iniciais, ambas, em estado estacio- 
nário, estão sobre o mesmo atrator. 


5.2. Mostre que, assumindo linearidade, 
ôn = FW (xo +60) — FM (xo), em que FM) 
corresponde a iterar o mapa F N vezes e 69 é 
uma pequena perturbação da condição inicial 
Lo. 


5.3. Mostre que a dimensão Dyy de um 
atrator regular (não-caótico) é dada por um 
número inteiro. 


5.4. À medida que uma mesma série tempo- 
ral (tamanho finito constante) for imersa em 
espaços de imersão de dimensões cada vez 
maiores, à probabilidade, de que dois pon- 
tos sobre o atrator estejam dentro de uma 
mesma vizinhança de tamanho (fixo) e, tende 
a zero. Argumente a favor ou contra essa afir- 
mativa e discuta as possíveis implicações que 
ela tem no cálculo da dimensão fractal de um 
atrator. 


5.5. Reproduza a Figura 5.7. Calcule a 
entropia informacional para u = 3 e acres- 
cente esse valor no gráfico. O que observou? 
Comente criticamente. 


5.6. Encontre o ponto no atrator de Róss- 
ler para a = 0,898,b = 2 e c = 4 correspon- 
dente ao ápice do mapa de primeiro retorno. 
Sendo um mapa unimodal, ele define 2 sím- 
bolos, um associado a um ramo outro asso- 
ciado ao outro ramo do mapa de primeiro 
retorno: chame-os de 0 e 1. Gere sequên- 
cias de Os e Is. Considere sequências com 
q dígitos consecutivos sem sobreposição, e.g. 
q = 2,3,4,5. Note que o número de com- 
binações possíveis será N = 2º. Estime a 
probabilidade de ocorrência de cada combi- 
nação, p;, usando a frequência relativa. Por 
fim, calcule entropia informacional (de Shan- 


non) como (ver Eq. 5.21): 


24-1 


H,=— > pilog, pj q-2,3,4,5. 
j=0 


Discuta o comportamento de H, à medida 
que q aumenta. 


5.7. Volte a considerar o sistema de Róss- 
ler no contexto do Exercício 5.6. Simule esse 
sistema em três condições caóticas distintas 
variando o parâmetro a. O único cuidado é 
garantir que o mapa de primeiro retorno seja 
unimodal, de forma a definir apenas dois sím- 
bolos. Calcule H, para cada condição discuta 
como a entropia informacional varia com o 
regime dinâmico correspondente. 


Capítulo 6 


Reconstrução do 
Espaço de Estados 


Este capítulo trata da reconstrução do es- 
paço de estados ou de fases, como é conhe- 
cida na literatura de dinâmica não linear. 
Para fins de motivação, considere o sistema 
x = f(x), sendo x E IR” o vetor de estado 
av(t) = [mi(t), xo(t)... zn(t)]” no instante t. 


No espaço de fases ou espaço de estados de 
dimensão n, o vetor de estado em um deter- 
minado instante to, a(to), é representado por 
um ponto (ver Fig. 6.1a). 


FIGURA 6.1: Espaço de fases. (a) O vetor de 
estado no instante to, a(to), torna-se um ponto; 
(b) e (c) indicam diferentes estágios da evolução 
temporal a partir de uma condição inicial. 


A evolução temporal do estado do sistema 
a(t), Vt > to a partir de uma condição inicial 
a(to) pode ser registrada representando a(t) 
à medida que o tempo passa (Fig.6.1). O 
retrato de fases do sistema é composto pela 
união das soluções do sistema tomadas a par- 


tir de todas as condições iniciais, mas não é 
incomum usar essa nomenclatura para se re- 
ferir à representação de uma (longa) traje- 
tória no espaço de fases, como em Fig. 6.1c. 


A reconstrução ilustrada na Figura 6.1 é, 
em certo sentido, trivial, pois basta tomar 
cada um dos componentes do vetor a(t) e 
registrá-los nos respectivos eixos. Mas como 
proceder no caso em que apenas um dos com- 
ponentes de a(t) é medido? Ou, de forma 
mais geral, assumindo a existência de uma 
função de observação (ou medição) A, tal que 
apenas uma série temporal é registrada do 
sistema s(t) = hja(t)|, h: Rº > R, ainda 
é possível reconstruir o espaço de fases? A 
teoria de imersão fornece uma resposta posi- 
tiva e determina as condições para as quais o 
espaço de fases reconstruído com s(t) é equi- 
valente ao original. 


Neste capítulo é visto ser possível, em 


geral, reconstruir um equivalente do espaço 
de fases original, mesmo quando apenas uma 
variável é medida. Nesse caso, o espaço re- 
construído, também chamado de espaço de 
imersão, respeitadas as condições estabeleci- 
das por um famoso teorema, conhecido como 
Teorema de Takens, é difeomórfico ao espaço 
original. A consequência disso é que os atra- 
tores reconstruídos no espaço de imersão são 
topológica-orbitalmente equivalentes aos res- 
pectivos atratores existentes no espaço de fa- 
ses original, que é normalmente inacessível. 


A caracterização de atratores apresentada 
no Capítulo 5 é válida tanto no espaço de 
fases original como no espaço de imersão — 
o único ao qual se tem acesso na prática — 
, supondo a equivalência topológica de tais 
espaços. Portanto, o primeiro passo necessá- 
rio para uma correta caracterização é realizar 
uma boa reconstrução. 


Na próxima seção são descritas as duas 


maneiras mais comuns de se reconstruir o re- 
trato de fases a partir de uma série temporal 
escalar, s(t). Como esperado, a qualidade do 
espaço reconstruído depende de h, ou seja, 
depende do que se mede. O conceito de ob- 
servabilidade de sistemas dinâmicos é muito 
útil na compreensão dos problemas relaciona- 
dos à reconstrução do espaço de fases. Esse 
assunto é tratado na Seção 6.2. e 6.3. Apesar 
de ser útil para entender situações práticas, 
os resultados discutidos em tais seções são 
essencialmente teóricos. Um procedimento 
prático para inferir a observabilidade de um 
sistema a partir de uma série temporal s(t) é 
discutido no Capítulo 7. Aspectos mais prá- 
ticos são discutidos na Seção 6.4. 


6.1 Imersão de 
Séries Temporais 


Em 1980 um grupo de quatro pesquisadores 
publicou um artigo! que veio a ser conside- 
rado o ponto de partida da aplicação de téc- 
nicas de imersão? no estudo de séries tempo- 
rais de sistemas dinâmicos não lineares. 
Esses autores mostraram um par de figu- 
ras parecidas com a Figura 6.2. Ao notar que 
os retratos de fase eram semelhantes, ape- 
sar das diferenças, a questão surgiu: as figu- 
ras são equivalentes em algum sentido? Em 
resposta a essa pergunta, os autores afirma- 
ram que tais figuras “certamente indicam que 
características topológicas e a forma geomé- 
trica do atrator mantêm-se intactas quando 


!Norman Packard, James Crutchfield, Doyle Far- 
mer e Robert Shaw, “Geometry from a time series”, 
Physical Review Letters, 45(9):712-716, 1980. 

2 Embedding, em inglês. 


vistas no plano x x 1” (Packard et al., 1980, 
petid 


det 
onr+ro 


0 2 
x(t) 


FIGURA 6.2: Projeções do atrator de Róssler. 
Sobre o plano (a) (x,y) nas coordenadas origi- 
nais, (b) (x, %) usando coordenadas diferenciais. 
As figuras são qualitativamente equivalentes. 


Nesse artigo, os autores procuraram 
quantificar em que sentido os atratores re- 
construídos são, ou podem ser considera- 
dos, semelhantes ao original. Para esse 
fim, calcularam o maior expoente de Li- 
apunov (Sec.5.1). O resultado relatado 
foi que a estimativa do máximo expoente 


de Liapunov do sistema original (x,y,2) é 
0,0677. Estimando-se o mesmo expoente a 
partir do espaço reconstruído (y,y,%y) obti- 
veram (,0680 e, seguindo um procedimento 
que envolve uma seção de Poincaré no es- 
paço (x, %,%), estimaram 0,0677. Com isso 
concluíram que tal procedimento de recons- 
trução é válido, apesar de não lograrem 
demonstrá-lo, nem determinar sob que con- 
dições o resultado é verdadeiro. 

No referido artigo, não apenas as coor- 
denadas diferenciais — construídas a partir 
de derivadas sucessivas da grandeza medida 
s(t) — foram consideradas, mas a conjectura 
dos autores era mais geral: “A ideia heurís- 
tica por trás do método de reconstrução é 
o de especificar o estado de um sistema tri- 
dimensionalº em qualquer instante de tempo. 


3Os autores restringiram a análise ao caso tri- 
dimensional, apesar de o método de reconstrução ser 
válido para dimensões superiores também. 


Para isso, quaisquer três quantidades inde- 
pendentes devem ser suficientes, em que “in- 
dependente” ainda não foi formalmente defi- 
nido (...). Conjecturamos que qualquer con- 
junto de três quantidades independentes, que 
única e suavemente localizam os estados do 
atrator, são difeomorficamente equivalentes” 
(Packard et al., 1980, p. 713). Em seguida 
os autores proveram um exemplo de coorde- 
nadas que atendem aos requisitos estabeleci- 
dos, a saber: x(t), v(t — 7) e x(t — 27). Esse 
sistema de coordenadas veio a ser conhecido 
como coordenadas de atraso, em que T é o 
tempo de atraso (Fig. 6.3). Incorretamente, 
alguns atribuem a Floris Takens a proposi- 
ção do uso das coordenadas de atraso. Como 
visto adiante, a importante contribuição de 
Takens para a área de imersão foi outra. 


No ano seguinte à publicação do artigo 
de Pakard e seus colegas, dois outros impor- 
tantes trabalhos foram publicados ('Takens, 


1981; Maúé, 1981). Apesar de o teor des- 
ses trabalhos ser essencialmente o mesmo, 
o de Floris Takens ficou muito mais conhe- 
cido do que o de Ricardo Maúé. Floris Ta- 
kens, um matemático holandês, havia publi- 
cado um importante artigo na área de siste- 
mas dinâmicos em que o termo caótico fora 
cunhado pela primeira vez (Ruelle e Takens, 
1971). Esse fato pode explicar a razão de 
seus resultados, publicados em 1981, serem 
conhecidos sob o título do Teorema de Ta- 
kens. Por outro lado, Ricardo Mané, um ma- 
temático uruguaio que completou seu dou- 
torado em 1973 no Instituto de Matemática 
Pura e Aplicada (IMPA) sob a orientação do 
conhecido Jacob Palis, é bem menos conhe- 
cido na área de dinâmica não linear aplicada. 
Apesar de raro, alguns autores referem-se ao 
Teorema de Takens-Mané. 


FIGURA 6.3: Atrator de Róssler. Em 
(a) mostra-se o atrator de Róssler e em (b) uma 
reconstrução em coordenadas de atraso. As fi- 
guras são qualitativamente equivalentes. 


Seja um sistema & = f(x), x E R”, 
com um atrator 4 de dimensão Do (veja 
Sec. 5.3). Seja uma função de medição ge- 
nérica, h, por meio da qual se mede um es- 
calar s(t) = hja(t)|, h: IR” > RR do sistema 
original, a partir do qual é possível definir o 
sistema de coordenadas 


(s(t), s(t— 7), s(t—27),...,s(t—(de— 1)7)). 
(6.1) 


Em essência, Takens e Mané demonstra- 
ram que a fim de que exista um difeomor- 
fismo global entre o espaço original e o es- 
paço definido pelo sistema de coordenadas 
em (6.1) — chamado de espaço reconstruído 
ou espaço de imersão (embedding space em 
inglês) — é suficiente (não necessário) que a 
dimensão de imersão satisfaça de > 2Do + 1. 
Em (6.1), 7 é o tempo de atraso e, no caso dos 
trabalhos de Takens e de Mané, que conside- 
raram séries temporais infinitamente longas 
e limpas, a escolha de 7 não é crítica, nem 
mesmo o é a escolha da função de medição 
h, desde que seja “genérica”. Como visto ao 
longo deste capítulo, a escolha de 7, h e de 
tem implicações práticas relevantes. 

As implicações práticas do teorema de 


Takens-Mané merecem atenção. Se no es- 
paço de imersão as trajetórias forem topoló- 
gica e orbitalmente equivalentes (Sec. 1.1.3) 
às trajetórias no espaço original, que per- 
manece desconhecido, é possível analisar e 
quantificar as características do atrator A no 
espaço de imersão, pois medidas geométri- 
cas — como dimensões, medidas dinâmicas — 
como expoentes de Liapunov e entropias (Ca- 
pítulo 5) — e medidas topológicas — como os 
números de enlace (linking numbers) — são 
invariantes ao sistema de coordenadas utili- 
zado. 


Para concluir esta seção, deve ser men- 
cionado que as coordenadas diferenciais e de 
atraso não são únicas. Um outro conjunto 
de coordenadas interessante, ainda que bem 
menos utilizado do que as coordenadas de 
atraso, é o que é gerado pela decomposição 
em componentes singulares (SVD, do inglês 
singular value decomposition) ou em compo- 


nentes principais (PCA, do inglês principal 
component analysis). Esse sistema de coor- 
denadas foi proposto como um sistema de co- 
ordenadas para imersão no clássico trabalho 
(Broomhead e King, 1986). As característi- 
cas desse sistema de coordenadas e sua equi- 
valência com as coordenadas diferenciais e 
coordenadas de atraso foram estudadas com 
detalhes por esses autores. 


6.2 Reconstruções a Partir 
de uma Variável 


Chamamos de & a transformação entre o es- 
paço original IRÊ (x,y, 2) e o espaço de imer- 
são ou reconstruído IRº(X, Y, Z). Comumente 
a transformação é obtida utilizando-se uma 
variável medida indicada por s(t). No caso 
de coordenadas diferenciais, o espaço recons- 
truído, de mesma dimensão que o original, é 
IRº(s, 5, 5) e a referida transformação escreve- 


se (ver Exercício 6.1): 


X=s 
Y=s E h(a) Ea oh f(x) 
Er dt da da 
o d/0h o2n | Oh 9f(a) 
je dt EO) (53 Ha de da E 


(6.2) 
Como visto depois, (6.2) pode ser escrita 
de maneira mais compacta utilizando as de- 
rivadas de Lie de h na direção do campo ve- 
torial f. Se a variável observada for a co- 
ordenada x do vetor de estado, ou seja, to- 
mando s = x = h(ax), a transformação O,=, : 
Rê(x,y,2) — Rê (X,Y, Z) pode ser es 
crita como: 


X=s=% 
Y=s=2=h= fo 
dad dis (Ola, Oto, (Ota, (Of, (68) 
dt dx dz oy oz 


em que f = fs = fy é à primeira equação 
de f,e fo fye fs = f, são os outros com- 


ponentes de f, ou seja, f(x) = [A fo fil” 
Além disso, no presente caso em que s = 


x: 0h/dex = [0h/dzx Oh/dy 0h/02] = 


[0.:0:0],-8ºh/00º = [0.00] e DO) = 
Of(a)/da é a matriz jacobiana do campo ve- 
torial f. Pode-se ver que (0h/dx)D(f) = 
[9 f./dx Ofs/dy Ofs/0z]. Substituindo-se es- 
sas entidades na última equação de (6.2), 
chega-se à última equação de (6.3). 

Outra nomenclatura útil usa o operador 
gradiente que, em coordenadas retangulares 


(e1,e2,..., en), é definido como 
s8f RUA 
Vf(a) = ré E... Dx, (6.4) 


em que e; são vetores unitários nas direções 
das coordenadas do espaço. Em forma veto- 
rial tem-se: 


(6.5) 


VE f(x) = [x | 


Usando o operador V, a matriz jacobiana 


pode ser expressa como: 


Vºfi(a) 
Vºfo(x) 


D(f) = (6.6) 


VT fu(a) 


Assim, a última equação de (6.3) pode ser 
reescrita como: 


Õfs 


LES dg TV Isla) fla). (6.7) 


Assumindo que &, define uma imersão, o 
espaço de fases original IR? (x,y, 2) e o espaço 
reconstruído IRº(X,Y,Z) são topológica e 
orbitalmente equivalentes (ver Sec. 1.1.3). 
Nesse caso deve ser possível, ao menos em 
princípio, encontrar um modelo f Rê 
Rê em IRº(X,Y, Z) equivalente ao campo ve- 
torial original f : IRÉ +» IRº em Rº(x,y,2). 
Aqui usamos o termo modelo para referir-nos 
ao campo vetorial no espaço reconstruído. 


Em outras palavras, deve ser possível escre- 
ver um modelo no espaço IRº(X,Y,Z) que 
seja equivalente ao sistema, que existe no 
espaço original IRº(x,y,2). Portanto, uma 
forma de escrever o modelo é 


X=Y 
V=Z (6.8) 
Z=fdX,Y,2), 


que lembra as formas canônicas companhei- 
ras na teoria de sistemas lineares. 

A construção de modelos f(X,Y,Z) a 
partir de dados é tratado no Capítulo 9. Por 
enquanto basta notar que modelos na forma 
canônica (6.8) são chamados de sistemas jerk 
e, em tais casos, de maneira a especificar o 
campo vetorial (do modelo) f, tudo que se 
precisa é conhecer f, : IR? +» IR. Quando o 
campo vetorial original f é conhecido, o mo- 
delo f. pode ser obtido de maneira analítica 
utilizando a transformação de coordenadas 


&., como ilustrado no próximo conjunto de 
exemplos, que usa o sistema de Róssler (Rôs- 
sler, 1976): 


L=-—y—z 
y=T+ay (6.9) 
Z=b+z(x—c), 


em que (a,b,c) são parâmetros. Nos exem- 
plos a seguir, cada variável de estado desse 
sistema é medida de cada vez, para formar 
s(t). O sistema de Róssler, por ser polino- 
mial, é muito apropriado para o tipo de es- 
tudo feito no presente capítulo. 


Exemplo 6.2.1 


Começamos definindo a função de medi- 
ção como s = h(x,y,Z) = y, OU seja, ape- 
nas a variável wy do sistema de Róssler é 
medida. A transformação de coordena- 
das que mapeia o espaço original para o 


espaço de coordenadas diferenciais é (ver 
Exercício 6.2): 


= 
y Y=z+ay (6.10) 
Z=-y-z+azr+ ay. 


& 
| 


Note como a última equação em (6.10) 
pode ser obtida a partir de (6.7). A 
fim de obter a correspondente função io 
do modelo (ver a última equação do sis- 
tema 6.8), devemos tomar a derivada 
temporal da última equação de (6.10): 


Z=-y-z+rar+ray. (6.11) 


A seguir substituímos %, 1 e 2 do campo 


vetorial (6.9): 


Z=-(v+ay)-[b+z(2-c)]+ 
a(-y— 2) +a?(x + ay). (6.12) 


Deve ser notado que as variáveis de es- 
tado do modelo f, são (X,Y,Z) e não 
(x,y,2), portanto é necessário substituir 
r=Y- 04 yv=- Nero XL 
em (6.12) de tal forma que o lado direito 
das equações dependa somente de X, Y 
e Z (ver Exercício 6.3). Isso resulta em 


CS) b-cX+(ac—- NY +(a— c)Z 
ax2+(a24+1)XY-aXZ-ayY2+yZ. 


(6.13) 


Da Eq.6.13 percebe-se que por ser 
polinomial o existe em qualquer ponto 
do espaço reconstruído (X,Y,Z2) = 
d, (x,y, 2). Isso pode ser constatado no- 
tando que a matriz jacobiana do mape- 
amento D(2,) sempre tem posto pleno. 


Assim (ver Eq.1.15), o jacobiano do 
mapeamento é estritamente positivo em 
todo o espaço, portanto d, é injetora e 
define um difeomorfismo, como visto na 
Sec. 1.1.3. Pelo fato de d, ser injetora 
em todo o espaço, diz-se que d, define 
um difeomorfismo global. 

O fato de d, definir um difeomor- 
fismo global significa que, mesmo que so- 
mente a variável y do sistema Róssler seja 
medida, ainda assim é possível recons- 
truir o espaço de imersão (X,Y,Z) = 
(y,y, y), que é topológica orbitalmente 
equivalente, globalmente, ao espaço de 
fases original (x,y,2). Como visto nos 
próximos exemplos, é relativamente raro 
ter-se um difeomorfismo global. 

A Figura 6.4 mostra a projeção 2D 
do retrato de fases no espaço de imersão. 
O formato básico da banda de Móbius do 
sistema reconstruído é equivalente àquele 


do sistema original em todo o espaço de 
fases. 


“E 
Aa 
Yor 
AE 
6 s. 4 3 Do ar 0 1 “oo 3 
X=y 
FIGURA 6.4: Projeção do sistema de Rós- 


sler para (a,b, c)=(0,398, 2, 4) sobre o plano 
(X,Y)=(y,y) (Letellier et al., 2006). O for- 
mato básico da banda de Móbius é facil- 
mente reconhecido. 


Exemplo 6.2.2 


Prossigamos a investigação sobre a re- 
construção do sistema de Róssler consi- 
derando que apenas a variável x é me- 
dida, s = h(x,y,2) = x. A transforma- 
ção de coordenadas neste caso, B,, é de- 
finida como (ver Exercício 6.4): 


Do Yo pr (6.14) 
Z=-zv-ay—b-z(x—c) 


e a correspondente função no espaço re- 


construído, fy, É 


(atc+Z-aY +b)Y 


a+c 


fe =ab-cX+X2-aXY+XZ+acY+(a-c)Z 


= 
(6.15) 


A função de é racional e tem uma sin- 
gularidade em X = a+c. Em outras 


palavras, sobre o plano (X,Y, Z)|x-a-+e; 
ie não é definida. Uma forma de cons- 
tatar que ia tem singularidades é notar 
que &, é injetora, mas o determinante da 
matriz jacobiana D(O,), que é o jacobi- 
ano, se anula para x = a+c. Assim, 
a transformação de coordenadas &,, que 
mapeia o espaço reconstruído ao espaço 
original, tem uma singularidade. Isso sig- 
nifica que o conjunto de pontos sobre o 
plano x = a + c, no espaço original, não 
pode ser representado no espaço recons- 
truído (X,Y, Z) usando a variável x. Pró- 
ximo à singularidade, ainda que matema- 
ticamente seja possível observar o espaço 
original, isso é difícil de alcançar na prá- 
tica. À medida que o sistema se afasta 
da singularidade, observar o estado origi- 
nal a partir de x torna-se gradualmente 
mais fácil. 

Este exemplo mostra que para obser- 


var o sistema de Róssler por meio da va- 
riável x não é tão conveniente quanto fazê 
lo a partir da variável y. Quando a variá- 
vel y é usada, esse sistema pode ser obser- 
vado em qualquer lugar do espaço, mas se 
a variável x for usada, o sistema de Rôss- 
ler torna-se “invisível” quando x = a-+c. 
Diz-se, então, que o espaço original não 
é observável sobre o plano x = a+c, a 
partir da variável x. 

A Figura 6.5 mostra a projeção do re- 
trato de fases do sistema de Róssler so- 
bre o plano. A forma da banda de Mô- 
bius ainda é visível. Por outro lado, no 
presente caso, a dobra do atrator parece 
um pouco mais “complicada” que a cor- 
respondente obtida quando a variável y 
foi usada na reconstrução (ver Fig. 6.4). 
Percebe-se que uma medida mais quan- 
titativa da observabilidade do sistema é 
útil. O problema de observabilidade é 


tratado com mais detalhes no Capítulo 7 
onde são descritas medida quantitativas 
de observabilidade. 


EX 


FIGURA 6.5: Projeção do sistema de Rós- 
sler. Com (a,b,c) = (0,398,2,4) sobre o 
plano (X,Y) = (x,%) (Letellier et al., 2006). 
A forma da banda de Móbius ainda é visível. 


Exemplo 6.2.3 


Para concluir a análise de reconstrução 
do sistema de Róssler, consideramos o 
caso em que tal sistema é reconstruído 
a partir da variável z, ou seja, s = 
h(x,y,2) = 2. A transformação de co- 
ordenadas, que mapeia o espaço original 
no espaço recostruído, &,, é (ver Exercí- 


cio 6.5): 


AC ESA 
de= Y=b+z(x—c) (6.16) 
Zen Sc) 


e a respectiva função f, é 


Fj 2 


fe b-cX-Y+aZ+ax EXava 


6.17 
| (ab+32)Y ay? - bz | 2by? — 2y8 Rê 


XxX x2 


Assim como is ie também não é defi- 
nida em todo o espaço (ver eq. 6.17). No 
presente caso, f. não é definida sobre o 


plano X = z = 0. Uma importante dife- 
rença entre as singularidades dessas fun- 
ções é que no caso de E a singularidade 
é de grau dois. Na prática, isso significa 
que o sistema não precisa estar tão perto 
de z = 0 para tornar-se difícil de obser- 
var. 


FIGURA 6.6: Projeção do sistema de Róss- 
ler com (a,b,c) = (0,398,2,4) sobre o plano 
(X,Y) = (2, 2) (Letellier et al., 2006). A es- 
trutura da banda de Móbius não mais pode 
ser reconhecida. 


A Figura 6.6 mostra a projeção no 
plano do retrato de fases do atrator de 
Róssler. Como pode ser visto, a estru- 
tura da banda de Móbius não mais pode 


ser reconhecida. Além disso, percebe-se 
que, próximo à singularidade z = 0, tre- 
chos da trajetória no espaço reconstruído 
espremem-se de tal forma que fica difícil, 
na prática, separá-las a fim de observar a 
dinâmica original. Na singularidade essa 
separação é, de fato, impossível, pois o 
mapeamento inverso 97! do espaço re- 
construído para o espaço original, não 
mais existe. 

Do ponto de vista pragmático, a diná- 
mica original torna-se practicamente não 
observável próximo ao plano z = 0 e não 
somente em z = 0. Portanto, compa- 
rando as Figuras 6.4, 6.5 e 6.6 não é di- 
fícil aceitar que é mais difícil inferir so- 
bre a aparência do atrator de Róssler se 
somente a variável z for medida, compa- 
rado ao caso em que qualquer das outras 
duas variáveis forem usadas para fazer a 
reconstrução. 


No Capítulo 7 é visto que uma maneira 
conveniente de interpretar singularidades no 
espaço é em termos da matriz jacobiana do 
mapeamento 6. Por exemplo, no caso do 
Exemplo 6.2.3 a matriz jacobiana de inte- 
resse é (ver Exercício 6.6): 

(0) (0) 1 


D(B.)= z (o) T— e x (6.18) 
b+2z(x — c) 2 (e-c)2-y-—2z 


que se torna de posto deficiente para z = 0, 
ou seja, o posto da matriz D(B,) é menor 
que 3 para z = 0. É interessante notar que 
para z = (0 não apenas a segunda coluna se 
anula, mas as duas primeira linhas tornam-se 
linearmente dependentes. Como D(2,) é de 
posto deficiente (singular) em alguma região 
no espaço (z = 0), então P, não define uma 
imersão (global). Contudo, pode-se conside- 
rar que 6, define uma imersão local. “Longe” 
de z = 0 o retrato de fases mostrado na 
Fig. 6.6 é, localmente, topologicamente equi- 
valente à parte correspondente no espaço de 
fases original, o que não ajuda muito na prá- 


tica, pois nessa região nada de “interessante” 
ocorre. Os principais efeitos da não lineari- 
dade, ou seja, a dobra e a reinjeção no atra- 
tor ocorrem em regiões mal representadas no 
espaço de reconstrução. 


O atrator de Róssler é um objeto (fino) 
fractal sem volume, mas que não pode ser 
imerso (reconstruído) em IR2. De fato, a di- 
mensão desse atrator é um pouco maior que 
2. Para fins de argumento, usamos Dy = 2 na 
discussão a seguir. De acordo com o teorema 
de Takens-Mané, a dimensão de imersão de = 
2Do+1 = 5 é suficiente. No Exemplo 6.2.3 a 
dimensão de imersão foi de = 3, para a qual 
o teorema não garante a existência de uma 
imersão, o que foi confirmado pelo apareci- 
mento da singularidade. Portanto, tomando 
por base esse teorema, deve ser possível en- 
contrar uma imersão — ou seja, um mapea- 
mento &, : IR?(2,3, 2) > IR“ — aumentando- 
se a dimensão do espaço reconstruído de. Em 


outras palavras, deve ser possível eliminar a 
singularidade que existe em D(%,) em dimen- 
sões mais altas. Como mostrado no próximo 
exemplo, é isso o que ocorre a partir da di- 
mensão de = 4. 


Exemplo 6.2.4 


Neste exemplo consideramos a recons- 
trução do sistemas de Róssler a par- 
tir da variável z no espaço de coorde- 
nadas diferenciais de dimensão 4. Ou 
seja, consideramos o espaço de recons- 
trução (2, 2, 22), 28), em que 2) é a 
i-ésima derivada temporal de z. Nesse 
caso, pode-se escrever (ver Eq. 6.16) 


A = 2 
Y=t=b+z(2x—c) 

= blc-m)+(x—c)2z-—-yz—s 
144 


'&= be? 4 c(—2bc — 3yz 422 + 3c€2z — & 
Hha-3exz + 2x2) +y(—3b + 3cz—az)+2(4c2—2b-c?), 


2 


em que o superescrito em Si indica 


a dimensão de imersão. Portanto O! : 
Rico IR (MY AN). 

Como discutido no Exemplo 6.2.3, ao 
reconstruir o sistema de Róssler no es- 
paço definido por (2, 2), 22)) E IR apre- 
senta problemas localizados, pois Dé não 
define uma imersão em z = 0. De fato, 
a matriz jacobiana do mapeamento entre 
o espaço original e o espaço tridimensio- 
nal de coordenadas diferenciais, 92 (ver 


Eq. 6.16), torna-se singular em z = 0. 
Deseja-se investigar o que ocorre com 
a matriz jacobiana da transformação de 
coordenadas quando a dimensão de imer- 
são aumenta de 3 para 4. Em outras pa- 
lavras, será que D(94) tem posto pleno 
de colunas? A última linha dessa matriz 


é composta pelas derivadas parciais 


ow 

2bc — 3yz 42? | (3c? 1)z + 2bx — 6cxz + 327? 
fofi 
ow 

z(-32+3c— a) — 3b 

Oy 
ow 

3xy 8xz+3ciz Er 3cz2 + rº+3cy ay+8cz—2b a 


Oz 


Para z = O tem-se: 


0 0 1 
(0) 0 T— c 


(x — o)? = y3a(c2 —y- em) 


2b(zx—c) —3b —3eyt3c2-atrê+(3c—a)y 


—2b—c? 


que é uma matriz com posto pleno (de 
colunas). As duas primeiras linhas ainda 
são linearmente dependentes, o que não 
é surpresa uma vez que uma matriz com 
4 linhas e 3 colunas não pode ter 4 li- 
nhas linearmente independentes. Assim, 
ao contrário de 63 : IRº +» IRº, O! 


Rê » IRº define uma imersão global. 
Esse resultado ilustra que aumentando-se 
a dimensão de imersão é possível remo- 
ver a singularidade que existe na matriz 
jacobiana da tranformação de coordena- 
das. Isso explica porque é possível obter 
modelos em 4D a partir da variável z do 
sistema de Róssler (Letellier et al., 1998). 


Exemplo 6.2.5 


Um modelo bastante realístico de uma 
cadeia alimentar envolve três espécies: 
roedores (x), cobras (y) e pavões (z) 
(Upadhyay et al., 1998). O campo ve- 
torial desse modelo é: 


t=a(l-z)-— 
x+a 
Ee cry YZ 
2 
: 2 gZ 
gia : 
/ v+h 


em que os parâmetros são a = 0,3109, 
2 0109 q— 24600 b- 0581 e 
IN qr ni 
4,5986. 

Como pode ser visto a partir dos re- 
tratos de fases mostrados na Fig. 6.7, não 
é óbvio qual das variáveis do modelo é 
a mais apropriada para a reconstrução 
da dinâmica original, apesar de ser mais 
fácil contar pavões que roedores ou co- 
bras. Sente-se necessidade de uma me- 
dida mais quantitativa para descrever a 
observabilidade de um sistema. Esse as- 


sunto é tratado no Capítulo 7. O es- 
tudo da observabilidade do modelo (6.19) 
foi originalmente discutido em (Letellier 
et al., 2002a). 


FIGURA 6.7: Projeções de atrator pro- 
duzido pelo modelo (6.19) sobre o plano 
(XY), em que Y =X ela) X = &, 
(b) X =yand (c) X = 2. Fonte: (Letellier 
et al., 20024). 


6.2.1 Ffeitos de simetria 


Um aspecto importante e menos explorado 
na imersão de séries temporais é a presença 
de algum tipo de simetria no sistema original. 
Tais sistemas são chamados de equivariantes, 
ou seja, existe um operador T tal que 


Efie)= (Ta); (6.20) 


em que T é uma matriz n x n que caracteriza 
a simetria. Por exemplo, o sistema de Lorenz 
investigado na Sec. 3.2.6 


=) 
U=r2—-y— sz (6.21) 
t=—bz+4 ay, 


é equivariante e tem simetria de rotação em 
torno do eixo z, como mostrado na Figura 6.8 
(ver Exercício 6.7). 


dx/dt 


FIGURA 6.8: Projeções do atrator de Lorenz 
sobre o plano (X,Y), com (a) X =x, (b) X =y 
e(c) X = z. O retrato de fases reconstruído a 
partir da variável z não apresenta simetria. Para 
q=10,"=28eb= E o sistema (6.21) converge 
para um atrator caótico (ver Fig. 3.13). 
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Em tal caso, o operador T é 


estos 00 
Es | sd (6.22) 
0 01 


ou seja, o sistema é globalmente invariante 
sob a ação do mapa (1,y,2) > (—x, — y,2). 
Nesse sistema, dois tipos de variáveis podem 
ser distinguidas: as variáveis x e y, que são 
mapeadas em seus recíprocos. Consequen- 
temente, tais variáveis permitem distinguir 
as duas asas do atrator; e a variável z, que 
mantém-se invariante sob a ação de 7. As- 
sim, a variável z não tem qualquer informa- 
ção sobre a simetria do atrator, pois as asas 
não podem ser diferenciadas (Fig.6.8) (Le- 
tellier e Gouesbet, 1996). 

De fato, como o uso da variável z para 
observar o sitema elimina a simetria, é essen- 
cialmente impossível recuperar tal simetria 
exclusivamente a partir do registro dessa va- 


riável. De forma geral, é crítica a escolha da 
variável de reconstrução em sistemas que têm 
alguma simetria (Leteller e Aguirre, 2002). 


6.3 Reconstrução 
Multivariável 


Até aqui consideramos dois casos extremos, 
do ponto de vista de reconstrução do espaço 
de fases: no caso ideal, quando todo o vetor 
de estado é medido, ou seja, s = x = h(x) = 
Ix, o espaço original pode ser representado 
perfeitamente. O outro extremo é considerar 
que somente um elemento do vetor de estado 
é medido, s = h(x) = Cx, e o vetor linha € 
é da forma C = [0...1...0], em queo 1 apa- 
rece na posição correspondente ao elemento 
de x que é medido. Por exemplo, no caso de 
um sistema de três dimensões, se somente a 
variável z for registrada, tem-se C = [0 0 1]. 


Agora desejamos considerar o caso em 
que mais de uma variável, mas não todas, 
estão disponíveis para a reconstrução. O 
que ocorre se fizermos uma imersão usando 
mais de uma variável? Chamamos isso de 
reconstrução multivariável. Intuição sugere 
que a reconstrução multivariável não é tão 
boa quanto a ideal — isso é mais ou menos 
óbvio —, mas deve ser melhor que a recons- 
trução realizada a partir de uma única variá- 
vel. No caso de reconstruções multivariáveis 
essa intuição nem sempre se confirma. Há ca- 
sos em que medir mais variáveis não é neces- 
sariamente vantajoso. Começamos definindo 
nomenclatura. 


Definição 6.3.1. Seja o sistema a(t) = 
Ff(a(t)), x e Rº do qual r < n variáveis 
de estado são medidas, ou seja, s = Ca, 
em que [s1...s,]] = s E IR” é o vetor me- 
dido e C e IR”. O conjunto de coorde- 
nadas no caso multivariável não é único e 


pode ser representado de forma geral como 
(s1,...,Sr,8)), em que s* é o conjunto com- 
plementar de coordenadas. No caso de coor- 
denadas diferenciais s* é composto por de- 
rivadas do conjunto medido (s1,...,s,) de 
modo que dim[s/+dim/s*/> n esNs* = 0. 


Exemplo 6.3.1 


Considere um sistema tridimensional 
com vetor de estado x = [x y z]” do qual 
as variáveis x e y são medidas (r = 2). 
Suponha que se deseje reconstruir um 
espaço que também seja tridimensional. 
Nesse caso tem-se: 


e=lol=lo io)» 


No caso escalar teríamos que fazer a 
reconstrução a partir de uma única variá- 


vel, digamos s = x. Supondo que o es- 
paço reconstruído seja IRê, no caso de co- 
ordenadas diferenciais usaríamos (x,%,%). 
No presente exemplo, também se re- 
gistra y e, portanto, temos duas gran- 
dezas medidas para reconstruir um es- 
paço de dimensão três, o que indica que 
o conjunto complementar de coordenadas 
é unitário. Podemos “expandir” a dinã- 
mica na terceira dimensão usando x ou 
y para compor s*. Se usarmos x, por 
exemplo s* = i, as coordenadas do es- 
paço reconstruído seríam (x,y,%). Por 
outro lado, se a variável y for usada para 
expandir a dinâmica, teremos s* = ye as 
coordenadas seríam (4, wy, 1). 


Exemplo 6.3.2 


Neste exemplo consideramos um sistema 
de dimensão quatro, com vetor de estado 
ag = [xy zw)” do qual somente y e w são 
medidos. Neste cason =4,r =2e há 
três conjuntos de coordenadas “naturais” 
em quatro dimensões, quais sejam: 


(1,1) 
(y, wW, W, 1), nesse caso s* = (ww, W) 


(y,wW,1),1)), nesse caso s* 


(y, wW, 1), W), nesse caso s* = (ty, 1). 


Por “naturais” queremos dizer que 
o mais natural é expandir a dinâmica 
usando derivadas de ordem mais baixa. 
Por exemplo, nada impede que conside- 
remos s* = (%y,w) no último caso, resul- 
tando em (wy,1w, 3), W) apesar disso não ser 
o mais “natural”. 


Definição 6.3.2. G e IR?*” é uma matriz 
de zeros e uns em que os uns indicam que 


variáveis medidas são usadas para compor o 
conjunto complementar de coordenadas s* e 
p é o número de tais variáveis. 


A estrutura da matriz G revela quais va- 
riáveis são usadas para compor s*. A forma- 
ção de G é ilustrada no exemplo a seguir. 


Exemplo 6.3.3 


Em cada uma das alternativas descritas 
no Exemplo 6.3.1, p = 1, pois somente 
uma variável, « ou y foi usada para com- 
por s*. No caso das coordenadas (x,y, ) 
tem-se G; = [100], e para (7,4,3), Gy = 
[0 1 0]. 

No Exemplo 6.3.2, os três conjuntos 
de coordenadas de imersão têm conjun- 
tos de coordenadas complementares s* 
diferentes. Consideremos uma a uma, 


a seguir. Pára s (qu, p-1pos 
somente w foi usada para compor s* e 
Gy = [0 10 0]. Semelhantemente, para 
su uv oc ooo 
que indica que somente w foi usada como 
variável complementar para expandir a 
dinâmica. Por fim, para s* = (yw), p= 
2eaG matriz respectiva é 


À semelhança do que ocorre no caso es- 
calar, o aumento da dimensão do espaço de 
reconstrução de, também tem o efeito de eli- 
minar singularidades. 


Exemplo 6.3.4 


Voltemos a considerar o Exemplo 6.3.4, 
mas no caso de y também ser medida. 


O conjunto de coordenadas (X,Y,Z) = 
(x,y, i) é dado por: 


É = di 
dry), Y=y (6.23) 
== Ss, 


em que os índices de 9,2, indicam as va- 
riáveis medidas e o fato de que o espaço 
reconstruído é formado com duas coorde- 
nadas geradas a partir de x. Sem maio- 
res análises é importante notar que em 
(6.23) existe informação de todas as va- 
riáveis de estado: x e y foram medidas, 
e a informação de z aparece em decor- 
rência de termos expandido a dinâmica 
usando x — veja a primeira equação do 
sistema de Róssler, que incluir z. A ma- 
triz jacobiana do mapa 8,2, é constante 
e não singular, indicando que o espaço de 
reconstrução (X,Y,Z) = (x,y,%) é glo- 


balmente difeomórfico ao original. 

Agora, suponhamos que estendamos 
o espaço usando y, ou seja, considere- 
mos o espaço de reconstrução (X,Y,Z) = 
(x,y, 9): 


Es 
Dop=4 Y=y (6.24) 
Vs 


Ao contrário do que ocorre em d,2,, a 
inclusão de 7 na terceira equação de 9, ,» 
não trouxe informação sobre a variável z, 
uma vez que 1 é uma combinação linear 
de x e y, como visto na segunda equação 
do sistema de Róssler. Não é surpresa, 
portanto, que a matriz jacobiana de 9, ,» 
seja singular. 


Em (Aguirre e Letellier, 2005) mostra-se 
como construir a matriz de observabilidade 
para o caso multivariado a partir de G, he 


do campo vetorial do sistema f. A matriz 
de observabilidade do par [f,h] é a matriz 
jacobiana do mapeamento & (Letellier et al., 
2005), tanto para o caso escalar como para o 
caso multivariável. 


6.4 Parâmetros de Imersão 


Na Seção 6.1 foi discutido o conceito de imer- 
são de uma série temporal. A ideia central 
é montar um conjunto de coordenadas para 
o espaço de imersão, a partir do registro de 
um escalar s(t) = h(x). Um dos casos mais 
simples ocorre quando a função de medição h 
retorna uma das variáveis de estado. Como 
construir um conjunto de coordenadas a par- 
tir de um único sinal? Um dos procedimentos 
discutidos neste capítulo consiste em tomar 
derivadas sucessivas do sinal registrado e usá- 
las para compor o conjunto de coordenadas, 
que nesse caso são chamadas de coordenadas 


diferenciais. Por exemplo, em (6.2) o con- 
junto de coordenadas diferenciais em IRÊ é 
(s,8,5). 

Um outro procedimento, que é mais usado 
na prática, consiste em tomar versões atra- 
sadas do sinal medido s(t) para compor o 
conjunto de coordenadas que, nesse caso, são 
chamadas de coordenadas de atraso, ver (6.1). 
Como pode ser visto, para definir o conjunto 
de coordenadas de atraso há três decisões 
a tomar. Primeiramente é necessário deci- 
dir qual variável medir. Tal decisão é co- 
mum às coordenadas diferenciais. A seguir 
deve-se escolher o tempo de atraso 7 e, por 
fim, a dimensão de imersão d.. Por exem- 
plo, suponhamos que para um determinado 
sistema seja registrada a variável y, ou seja, 
u(t) = s(t) = h(a) e se deseje reconstruir um 
espaço de dimensão de = 4 com 7 = 10. As 
coordenadas de atraso nesse caso são: 


(x(t), x(t — 10), x(t — 20), z(t — 30)). (6.25) 


em (6.25) há um certo abuso de nomencla- 
tura, pois misturamos o domínio de tempo 
contínuo, pois t € IR, e o de tempo discreto, 
pois 7 € IN*. Vejamos isso em detalhes para 
deixar o procedimento claro. Seja um sinal 
em tempo contínuo x(t) que deve primeiro 
ser amostrado. Para isso escolhe-se um in- 
tervalo de amostragem T; com base no teo- 
rema de amostragem de Shannon, por exem- 
plo. Esse é um procedimento típico em pro- 
cessamento de sinais ou controle digital. As- 
sumimos que T, foi escolhido. Assim, o sinal 
amostrado corresponde à seguinte sequência 
de valores: x(kTs;), k = 1,2,.... Note que kTs 
tem unidade de tempo. É comum represen- 
tar essa sequência de valores simplesmente 
por x(k). Agora, o conjunto de coordena- 
das de atraso com as especificações descritas 
anteriormente é 


(e(k), 2(k— 10), 2(k—20), e(k—30)), (6.26) 


em que todos os elementos no argumento de 


x são inteiros. A representação em tempo 
contínuo — que não usamos — é: 


(v(kT;), v([k 5 + Loja v([k E 20/05); 
=([k — 30/79). 


Tomemos um ponto no espaço 
de reconstrução, por exemplo: 
(x(200), (190), (180), x(170)). 

Nesse caso, o ponto seguinte é 
(x(201), x(191),x(181),x(171)) e assim 
sucessivamente. Deve estar claro que 7 > 1 
significa que o tempo de atraso é maior 
que o tempo de amostragem, o que é uma 
situação comum. 

Quanto à escolha do tempo de atraso, 
note que se 7 for muito pequeno, as coorde- 
nadas estarão fortemente correlacionadas e 
o espaço reconstruído tende a apresentar as 
trajetórias espremidas em torno da diagonal 
principal do espaço. No outro extremo, estão 
valores de 7 muito grandes a ponto de as co- 


ordenadas perderem correlação. Nesse caso o 
retrato de fases reconstruído fica descaracte- 
rizado. É possível escolher 7 por tentativa e 
erro juntamente com uma análise visual do 
espaço reconstruído. Formas quantitativas 
de escolher o tempo de atraso envolvem o 
uso de informação mútua (Fraser e Swinney, 
1986) ou de funções de correlação linear e não 
linear (Aguirre, 1995b). Em ambos os casos o 
objetivo é encontrar um tempo de atraso tal 
que as coordenadas não estejam fortemente 
correlacionadas. 


Quanto à determinação da dimensão de 
imersão de, possivelmente o algoritmo mais 
usado se baseia no conceito de falsos vizinhos 
(Kennel et al., 1992). A ideia central é bas- 
tante intuitiva. Considere uma órbita perió- 
dica com periodicidade dois. Projetando-se 
essa órbita no plano, há necessariamente um 
cruzamento, onde podemos encontrar pontos 
vizinhos. Ao aumentar a dimensão do es- 


paço para três, uma parte da órbita passa 
por cima e a outra passa por baixo, de modo 
que os pontos que eram vizinhos não mais o 
são. Esses vizinhos são chamados de falsos 
vizinhos. Um procedimento viável é come- 
çar com uma dimensão de imersão admitida- 
mente baixa, escolher um certo conjunto de 
vizinhanças e contar o número de vizinhos. 
Aumenta-se a dimensão de imersão volta-se 
a contar o número de vizinhos. Esse número 
é menor, pois alguns falsos vizinhos desapa- 
receram. Esse processo é repetido até que 
o número (ou a proporção) de vizinhos não 
mais seja alterado, indicando que não mais 
há falsos vizinhos e que, portanto, essa di- 
mensão pode ser utilizada como dimensão de 
imersão. 


Alguns desses pontos são ilustrados no 
exemplo a seguir. 


Exemplo 6.4.1 


Neste exemplo consideramos o atrator 
corda, que é simulado com intervalo de 
integração ót = 0,01 e mostrado na Fi- 
gura 6.9. 


FIGURA 6.9: Atrator corda no espaço ori- 
ginal (x,y,2). 


Quando se tem acesso a mais de uma 
variável, o primeiro passo é decidir qual 
delas usar para fazer a reconstrução. Essa 
escolha pode ser feita com base na teo- 


ria de observabilidade e de procedimen- 
tos detalhados no Capítulo 7. No pre- 
sente exemplo usamos a variável x, uma 
vez que usando-se qualquer outra variá- 
vel não é possível representar a corda ade- 
quadamente. Como o sinal não foi rea- 
mostrado, neste caso T; = dt = 0,01. 

A seguir, usamos a informação mútua 
para determinar um valor adequado para 
o tempo de atraso 7. Escolhe-se esse pa- 
râmetro em torno do primeiro mínimo da 
informação mútua, que neste caso ocorre 
T = 15, como visto na Figura 6.10. 

Há procedimentos mais simples que 
usar a informação mútua, ainda que tal- 
vez sejam um pouco menos eficientes. Um 
deles é tomar o valor de 7 por volta de 
1/4 do valor para o qual a função de au- 
tocorrelação do sinal cruza o zero. Neste 
exemplo, o cruzamento ocorre por volta 
do atraso 100, portanto esse critério su- 


gere 7 = 25. Um outro procedimento pa- 
recido é usar o primeiro mínimo da fun- 
ção de autocorrelação do sinal quadrá- 
tico, removida a média. Ou seja, neste 
caso calcula-se a função de autocorrela- 
ção de x(t)2—a(t)2, em que a barra indica 
o valor médio. O gráfico dessa função é 
mostrado na Figura 6.11 e mostra que o 
primeiro mínimo ocorre em 7 = 21. 

O passo seguinte é determinar a di- 
mensão de imersão de. Isso será feito 
utilizando-se o algoritmo de falsos vi- 
zinhos. O resultado mostrado na Fi- 
gura 6.12 indica que após de=3 pratica- 
mente não há mais redução na proporção 
de falsos vizinhos. Portanto esse valor de 
dimensão de imersão parece adequado. 
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FIGURA 6.10: Informação mútua calcu- 
lada a partir de x. O mínimo ocorre em 
7 = 15 (QEmbedCora). 
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FIGURA 6.11: Função de autocorrelação 
de x(t)2 — x(t)2. O primeiro mínimo ocorre 
em7T=21. 


A reconstrução do atrator corda em 
coordenadas de atraso com os parâme- 
tros de imersão escolhidos pode ser vista 
na Figura 6.13. As principais caracte- 
rísticas topológicas do atrator foram, ao 
menos visualmente, preservadas. Não há 
diferença significativa entre a reconstru- 


ção com 7 = 15 comparada à que foi re- 
alizada com 7 = 21. Dada a facilidade 
de se usar a função de autocorrelação do 
sinal quadrático, um procedimento prá- 
tico é começar com essa ferramenta para 
determinar um valor inicial do atraso de 
tempo e refinar o resultado se necessário. 
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FIGURA 6.12: Proporção de falsos vizinhos 
calculada a partir de x. Atinge-se o zero em 
de = 3 (Qembedcord). 
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FIGURA 6.13: Atrator corda em coorde- 
nadas de atraso reconstruídocom de=3 e 
(a) 7=15, (b) 7=21 (QEmbedcora). 


Leitura Recomendada 


Os primeiros trabalhos na aplicação de téc- 
nicas de imersão em sistemas com dinâmica 
não linear foram (Packard et al., 1980; Ta- 
kens, 1981). Aspectos gerais sobre imersão 
podem ser encontrados em (Monteiro, 2002; 
Fiedler-Ferrara e Prado, 1994). A reconstru- 
ção multivariável do espaço de estados, ou 
seja, à reconstrução utilizando mais de uma 
variável medida sob o aspecto da observabi- 
lidade foi discutida em (Aguirre e Letellier, 
2005). 

O caso de reconstrução multivariável foi 
tratado em (Aguirre e Letellier, 2005), em 
que a conexão com a teoria de observabili- 
dade também é feita. A relação entre a teo- 
ria de imersão de de observabilidade foi dis- 
cutida em (Letellier et al., 2005), em que se 


mostrou que a matriz jacobiana do mapa & 
entre o espaço original e o espaço de recons- 
trução usando s = h(ax) é a matriz de obser- 


vabilidade do par [f, A]. 


A literatura sobre a teoria de imersão e 
de reconstrução do espaço de fases é extensa. 
Trabalhos pioneiros, além dos que foram ci- 
tados no capítulo, são (Buzug et al., 1990; 
Casdagli et al., 1991; Buzug e Pfister, 1992b). 
Sobre a escolha da dimensão de imersão, Cao 
propôs uma modificação ao algoritmo clás- 
sico de Kennel que usa o conceito de falsos vi- 
zinhos (Cao, 1997). Sobre esse assunto uma 
importante observação feita por James Thei- 
ler (Theiler et al., 1992b) é que ao contar vi- 
zinhos é importante desconsiderar os pontos 
que são vizinhos no espaço por serem “vizi- 
nhos” no tempo. Ou seja, trechos consecuti- 
vos no tempo do sinal aparecem como vizi- 
nhos no espaço, mas não são esses vizinhos 
que importam. Theiler então definiu um in- 


tervalo temporal mínimo a partir do qual tre- 
chos podem ser considerados vizinhos no es- 
paço. Esse intervalo é conhecido como a ja- 
nela de Theiler (do inglês Theiler's window). 


Exercícios 


6.1. Derive a última equação de (6.2). Para 
isso, use a regra da cadeia e o resultado da 
segunda equação de (6.2). 


6.2. Usando (6.3) derive (1.41). 


6.3. Obtenha a Eq. 6.13. Como interpreta 
essa equação? Qual é o domínio no qual essa 
equação é definida? 


6.4. Usando (6.3) derive (6.14). Obtenha 
(6.15). Qual é o domínio no qual essa equa- 
ção é definida? Como a compara com a fun- 
ção (6.13) obtida quando a variável medida 
éy? 


6.5. Usando (6.3) derive (6.16). Obtenha 
(6.17). Compare essa função com as análo- 
gas F, e F, e compare-as no que diz respeito 
ao domínio em que são definidas? Que im- 
plicações práticas têm suas constatações? 


6.6. Encontre (6.18) a partir de (6.16). 
Como poderia utilizar (6.18) para encontrar 
as singularidades de F, em (6.17)? 


6.7. Para o sistema de Lorenz, mostre que 
(6.20) se verifica com T dada por (6.22). 


Capítulo 7 
Observabilidade 


A fim de motivar o problema da observabi- 
lidade de um sistema dinâmico a partir de 
suas variáveis de estado, considere o sistema 
de Róssler, cujo atrator é mostrado na Fi- 
gura 7.la. Nesse espaço original (x,y,2Z) E 
Rê é possível constatar que esse atrator é 
“bem comportado” no sentido de que trechos 
vizinhos da trajetória parecem manter uma 
separação bastante uniforme. 


Os demais gráficos na Figura 7.1 mostram 
projeções do atrator sobre planos específicos. 
Deve ser lembrado que os “cruzamentos” de 
trajetórias nesses planos são falsos, pois são 
artefatos do procedimento de projeção em su- 
bespaços de dimensão mais baixa. Na análise 
a seguir não desejamos nos ater a esses artefa- 
tos, mas observamos que somente no plano x- 
y trechos vizinhos da trajetória mantém uma 
separação aproximadamente uniforme. Note 
como na Figura 7.1c, para valores q < —1 
os trechos da trajetória parecem se amassar 
e aglomerar em uma região muito estreita do 
plano. Semelhantemente, para a Figura 7.1d, 
na base da figura, a trajetória é comprimida. 
Nessas regiões de “aperto” é difícil distinguir 
dois estados que estejam em trechos separa- 
dos da trajetória. Essa dificuldade é uma 
manifestação de problema relacionado à ob- 
servabilidade. 


Outra maneira de ver esse problema é no- 


tar que a projeção na Figura 7.1b parece re- 
presentar o atrator original de maneira mais 
fiel do que as outras duas. Se notarmos que 
no plano x-y (Fig. 7.1b) a variável z não é 
utilizada, parece justo conjecturar que essa 
variável faz muito menos falta para a aná- 
lise correta do atrator do que x e y pois, 
quando omitidas, como nas projeções das Fi- 
guras T.1(c-d), aparecem regiões de aperto 
nas respectivas projeções. De fato, é pos- 
sível quantificar o fato de que as variáveis x 
e y permitem melhor observabilidade da di- 
nâmica do que a variável 2. 


FIGURA 7.1: (a) Atrator de Róssler e suas pro- 
jeções sobre os planos (b) x-y, (c) x-z e (d) y-z. 


O objetivo deste capítulo é apresentar con- 
ceitos relacionados à observabilidade e des- 
crever procedimentos para ordenar as variá- 
veis de um sistema em termos da qualidade 


de observabilidade atingida com cada um de- 
les. Assume-se que em todos os casos o sis- 
tema é observável por meio da variável inves- 
tigada. Portanto, não estamos preocupados 
com estabelecer se o sistema é observável ou 
não, mas, dado um conjunto de opções ob- 
serváveis, determinar qual delas é a melhor. 
O capítulo está estruturado de forma seme- 
lhante ao trabalho (Aguirre et al., 2018). 


7.1 Fundamentos 


Nesta seção é dado um pouco de contexto 
histórico. Para fins de apresentação, as prin- 
cipais ideias são ilustradas usando o sistema 
de Róssler. 


7.1.1 Observável ou 
não observável 


Os conceitos de observabilidade e de contro- 
labilidade de sistemas lineares foram propos- 
tos por Rudolf Kalman (Kalman, 1960). Seja 
o sistema linear 


x Az + Bu 
À RE (71) 


em que x € IR” é o vetor de estado, s E IR? 
é o vetor de medições, u € IR” é o vetor de 
entrada e (4, B,C) são matrizes constantes 
chamadas, respectivamente, de matriz diná- 
mica, matriz de entrada ou de controle e ma- 
triz de saída ou de medição. O sistema (7.1) 
é observável no instante tr se o estado ini- 
cial, ou seja, a condição inicial, a(0) pode ser 
determinada unicamente a partir do conheci- 
mento de um registro da dados finito da saída 
s(T), 0 <7 < tr (Chen, 1999) e da entrada 
u(7), no caso de sistemas não autônomos. 


Uma maneira de testar se o sistema (7.1) 
é observável é construir a matriz de observa- 


bilidade: 
Oo GA GA iu GARE (ço) 


O sistema (7.1), ou o par [4,C], é dito ob- 
servável se O tiver posto pleno, ou seja, se 
PIO] = n, em que p indica o posto da matriz, 
que é definido como o número de colunas li- 
nearmente independentes da referida matriz. 
Essa condição é conhecida como a condição 
de posto de Kalman. De acordo com essa 
condição, o par [4,C] é observável se e so- 
mente se o posto de O for igual a n. Nessa 
definição não existe meio termo. 

Uma outra maneira de testar a observa- 
bilidade de um sistema é construir a matriz 
gramiana, ou o gramiano. Se o gramiano de 
observabilidade tiver posto pleno, o sistema é 
observável. Sabe-se que o posto do gramiano 
eo de O coincidem. Uma questão importante 


é que o condicionamento numérico de O e do 
gramiano de observabilidade não estão corre- 
lacionados, ao menos para sistemas lineares 
(Sun e Motter, 2013). Ou seja, a matriz O 
pode estar bem condicionada e o gramiano 
não, ou vice-versa. 

Os conceitos de controlabilidade e obser- 
vabilidade foram estendidos para sistemas não 
lineares na década de 1970. Um dos traba- 
lhos pioneiros mais influentes é (Hermann e 
Krener, 1977). Considere o sistema não li- 


near: à E Fi 
| s(t) = h(aº), Efe) 


com f : IR” > IR” e, por simplicidade s(t) E 

R, ou seja h : Rº > R. Derivando s(t) em 
relação ao tempo resulta em: 
h h 

s(t) = Ch(a) = a = Srta) = Lrh(a). 

(7.4) 

Leh(a) é a derivada de Lie de h na direção 


do campo vetorial f e st) — Lih(a). Assim, 
a matriz de observabilidade pode ser escrita 
em termos de derivadas de Lie como: 


=| 9LSh(a) dee o 


Oda 
(ax) e = 


(7.5) 
em que o sub-índice s foi usado para enfati- 
zar que O,(x) se refere ao sistema quando é 
obsevado por meio de s(t). 

O par [f,h(x)| em (7.3) é dito observá- 
vel se p[Os(a)|] = n, Vx E R” (Hermann e 
Krener, 1977), que é a condição análoga à 
de observabilidade para sistemas lineares de 
Kalman. Se [f,h(a)] for observável, quais- 
quer duas condições iniciais %9, € Zo, são dis- 
tinguíveis a partir da série temporal medida 
s(t), t > 0. 

Como a observabilidade é determinada por 
meio de uma condição de posto nos dois ca- 
sos, tanto os pares lineares [4,C] como não 
lineares [f, h(x)] são classificados em apenas 


duas categorias: observáveis ou não observá- 
veis. 

Um interessante passo na área de teoria 
de sistemas e de imersão foi dado ao perceber 
que a matriz de observabilidade em (7.5) é a 
matriz jacobiana do mapa 


D, : Rº(x) > Rº(s(t), SD... s0-D), (7.6) 


entre o espaço original e os espaço de imer- 
são n-dimensional de coordenadas diferenci- 
ais (Letellier et al., 2005). Para cada função 
de medição s(t) = h(a), tem-se um espaço 
de imersão n-dimensional que é conectado ao 
espaço original por seu respectivo mapa &,. 
Se P, for invertível (injetora), é possível re- 
construir o estado a partir de s(t) de modo a 
ser topologicamente equivalente. A condição 
para a invertibilidade de 6, em x é 


0, o 
p | dE In mn: (7.7) 


Portanto, o sistema é localmente observável 
em x se a condição (7.7) for verificada, ou 
seja, se &, for localmente invertível. Se &, for 
constante e invertível, existe um difeomor- 
fismo global e o par [f,h] é completamente 
observável. Quando o espaço de reconstru- 
ção é n-dimensional e, assim, e é uma ma- 
triz n xn, pode ser útil expressar a condição 
(7.7) como (Letellier e Aguirre, 2002) (veja o 
Exemplo 7.1.1): 


o, 
e 0. (7.8) 


Se a dimensão do espaço de reconstrução 
for aumentada usando-se 


d, :Rº(x) 5 Rs(t),sD, ..., se) (7.9) 


Det 


com de > n, normalmente singularidades pre- 
sentes em &, não existirão em dimensões mais 
elevadas, ou seja, b, gradualmente se torna 
uma matriz de posto pleno, com é de se es- 
perar do teorema de Takens (Takens, 1981). 


Outra forma de ver isso é a seguinte: seja 
%; = b,x, em que x € IR” é o estado no 
espaço original e x, € R$ é o estado no es- 
paço de imersão que, por definição, encontra- 
se no espaço imagem da matriz 6,. Como 
existe no espaço euclideano de dimensão n, 
para que x, seja seu correspondente, é neces- 
sário que também esteja em um espaço com 
essa dimensão. Esse espaço, como mencio- 
nado, é a imagem de 6, que, portanto, deve 
ter posto n. 

Situações em que o espaço de reconstru- 
ção é formado usando-se mais de uma variá- 
vel foram discutidas brevemente na Sec. 6.3 
e com mais detalhes em (Aguirre e Letellier, 
2005). 


Exemplo 7.1.1 


Seja o sistema de Róssler (Róssler, 1976): 


gh = Si e 
y =2z+ay AO) 
Z =b+2z(x—c), 


em que (a,b,c) são parâmetros. Neste 
exemplo derivamos a matriz de observa- 
bilidade para o caso de s = y = h(a). 
Começamos notando que podemos escre- 
vers = Cx em que O = [010]. As 
coordenadas de reconstrução em IRÊ são 
(s, 8,5), portanto: 


S4i(x) = [s 5 8)", pi) 
ou seja, Bi(x), mapeia o espaço original 


ag = (2,y,2) em (s,8,5). Por definição, 
a matriz de observabilidade é a matriz 


jacobiana de &,(x), ou seja, 


Ole) = E a Ê 


Gb) 


No restante deste exemplo derivamos a 
expressão em (7.12). A primeira linha de 
di(a) —- veja Eq. 7.11 -é5s = Cr. A 
segunda linha é s = Cã = Cf(x). Por 
fim, a terceira linha é 


O f(x) 
o f(x). (713) 


Reed 
5 = 4 CHe)=c 


Para chegar à matriz de observabili- 
dade deve-se calcular a matriz jacobiana 
do mapa, como visto em (7.12), isso é 
feito a seguir, linha por linha. A primeira 
linha da matriz de observabilidade é 

ENGis 


em que foi substituído o valor de €, que 
indica que a variável medida é y. A se- 
gunda linha de O(ax) é: 


ocre) — cOfe) 
dx E dx 


O f(x) 


=[010) 
Wo = = 
= od) a 6 
=D E oa) 


A terceira linha da matriz jacobiana é a 
derivada de (7.13) com respeito a x, ou 


seja E [2 (a) | 


Determinemos primeiro a parte dentro 


dos colchetes: 


ie) 
2 f(2) = [a 0)y(2) 


=[LaoOllf fo fa] 
= a, 
— —y—z+a(x-+Hay), (7.14) 


C 


em que f; é a i-ésima equação do sistema 
de Róssler. A derivada de (7.14) em re- 
lação ao vetor ax é a terceira linha da 
matriz de observabilidade: 


del-u-a+a(a-+ay) =[a (a?-1) —1]. 


Portanto, a matriz de observabilidade é 


953 (on 0 
da Oulm)= a OA) 
ja an So A 


em que Oi : Rº(x) > R“(y(t), yD, gy) 
e O,(x) é constante e não singular. Por- 
tanto, o sistemas de Róssler é observável 
a partir de y em qualquer ponto do espaço 
de estados. 


7.2 Observabilidade 
Estrutural 


O adjetivo estrutural foi usado em (Lin, 1974) 
para indicar os casos em que a controlabili- 
dade é robusta com respeito a perturbações 
paramétricas. Aqui usamos estrutural em 
um sentido um pouco mais amplo, mas ainda 
assim bem relacionado. 

Chamamos de observabilidade estrutural 
à qualidade atribuída por métodos ou crité- 
rios que classificam um sistema como sendo 
observável ou não. À justificativa para isso é 


que, em tais casos, a observabilidade depende 
da estrutura interna das variáveis do sistema, 
isto é, da presença e natureza dos termos de 
acoplamento que aparecem nas equações. Ou 
seja, pequenas perturbações em parâmetros 
não nulos não alteram a condição de obser- 
vabilidade. Nesse sentido, as definições de 
Kalman para o caso linear e de Hermann e 
Krener, para o não linear (Hermann e Kre- 
ner, 1977), pertencem a essa classe ainda que 
às vezes se fale em termos de observabilidade 
completa ou plena. Outros termos tais como 
observabilidade ou controlabildiade exata e 
matemática também são encontrados na li- 
teratura (Wang et al., 2017). 


No restante desta seção são revistos os 
métodos propostos em (Lin, 1974) e em (Liu 
et al., 2013). No trabalho de Liu e colegas 
procura-se o menor conjunto de sensores que 
torne um grafo observável. 


7.2.1 O métod de Lin 


Em um artigo clássico, Lin desenvolveu o 
conceito de controlabilidade estrutural (Lin, 
1974) que posteriormente foi estendido para 
incluir observabilidade estrutural em (Chang 
e Shachter, 1992). Tais conceitos foram defi- 
nidos para sistemas lineares na forma (7.1). 
Assim, o par [4,C] é estruturalmente obser- 
vável se existir um par “perturbado” [4,,C1] 
de mesma dimensão com a a mesma estru- 
tura que também seja observável. Dizemos 
que [4,C] e [4;,C1] têm a mesma estrutura 
se para cada elemento nulo de [4,C] o ele- 
mento correspondente em [A1,C1] também é 
nulo, e vice-versa (Chang e Shachter, 1992). 
Além disso, [41,€4] é um par perturbado de 
[4,C] no sentido de que existe e > 0 tal que 
W|A—Ail|<eel|C-—Ci ||<e. Por exemplo, 
considere o par de matrizes 


Am 0) 
die C= LOL O trio 
Ee Xu E [ 1 ] ( ) 


em que os elementos não nulos podem assu- 
mir qualquer valor. A matriz de observabili- 
dade (7.2) do par [4,C] em (7.16) é de posto 
deficiente, ou seja, não tem posto pleno, in- 
dependentemente dos valores de A;; e de Ch. 
Portanto, o par (7.16) é (estruturalmente) 
não observável. 


Uma análise interessante proposta por Lin 
é desenhar o grafo para o par [4,b], lembre- 
se que ele tratou do caso de controlabilidade. 
Uma extensão do procedimento de Lin para 
o caso de observabilidade pode ser realizada 
facilmente lançando mão do teorema da du- 
alidade (Chen, 1999) por meio do qual o par 
[4, c”] é estruturalmenet observável se e so- 
mente se seu dual [A”,c| é estruturalmente 
controlável. Quando a matriz A é transposta, 
as setas das arestas do grafo correspondente 
devem ter sua direção invertida. O par [4, c”] 
corresponde ao caso monovariável, ao passo 
que [4, C] pode tanto ser monovariável - nesse 


caso C é um vetor linha — como multivariá- 
vel, em que C é uma matriz. 


Exemplo 7.2.1 


Neste exemplo mostra-se como o siste- 
mas de Róssler (7.10) pode ser represen- 
tado por meio de um grafo. Ao fazer isso, 
podemos seguir um procedimento seme- 
lhante ao proposto por Lin. O ponto de 
partida é a matriz dinâmica 4 e o ve- 
tor de entrada b. A controlabilidade do 
sistema de Róssler pode ser investigada 
usando a matriz jacobiana Df de (7.10) 
e algumas alternativas para o vetor b: 


o —1 —1 it 0) 0) > z 
Df :b]= > y(7.17 
ER] o cg o 0 10 RG 
> 2 
z (0) v—c 0 oj l 


em que b, indica que o sinal de controle 
é aplicado à primeira equação. b, e b, 
são definidos de maneira análoga. A Fi- 
gura 7.2a mostra o grafo correspondente 
ao par [D f, [00 1]"]. 


FIGURA 7.2: Grafos para análise de con- 
trolabilidade e observabilidade. (a) Grafo 
do par [Df, b,) em que b, = [001 éo 
vetor de entrada. (b) Grafo de [(Df)”,c.], 
que é o dual de (a), em que c7 = [001] é 
o vetor de entrada. Linhas pontilhadas in- 
dicam conexões que não são constantes, que 
são resultantes de não linearidades. Note 
a semelhança com o grafo na Figura 7.4a. 
Fonte: (Aguirre et al., 2018). 


A primeira equação do sistema de 
Róssler mostra que % depende de y e de 
z, portanto, no grafo desenhamos arestas 


saindo de y e de z em direção a x. Além 
disso, como a relação na primeira equa- 
ção é linear — os elementos na primeira 
linha de (7.17) são constantes — desenha- 
mos as arestas contínuas. No caso da 
terceira equação, £ depende não linear- 
mente de x e de si mesma. Na terceira 
linha de (7.17) vemos os elementos z e 
ag — c, que não são constantes. Como 
resultado disso, pontilhamos as arestas 
correspondentes. Note que o termo cons- 
tante na terceira equação não está repre- 
sentado na Figura 7.2a. 

Os nós x e y podem ser acessados 
a partir do nó b,. Portanto, o sistema 
de Róssler é estruturalmente controlá- 
vel se acionado a partir do nó b, vertex. 
Quando o controle é aplicado à variável 
y, O nó x é acessível, mas o nó z não se a 
aresta pontilhada for para zero (z = 0). 


O par [Df, [010]"], portanto, não é es- 


truturalmente controlável para z = 0. 
Resultado parecido é obtido para o par 
DF, [100]. 


Para investigar a observabilidade 
usando o resultado de Lin, devemos em- 
pregar o sistema dual, mostrado na Fi- 
gura 7.2b. Para z = 0 a conexão do nó 
z para o nó x se anula e tanto x como y 
tornam-se não acessíveis. Portanto para 
z=0o par [(Df)”,c] é não controlável e, 
usando o teorema da dualidade, isso im- 
plica que [Df,c”| não é observável para 
z = 0, como visto no Exemplo 7.3.1. 

Procedendo dessa forma é possível ve- 
rificar que o par [D f, [010]] é estrutural- 
mente observável. Isso está de acordo 
com o fato de que existe um difeomor- 
fismo global entre o espaço original e o 
espaço com coordenadas (y,%y,%y) (Letel- 
lier et al., 2005). 


A observabilidade estrutural não é capaz 
de distinguir, dado um sistema observável, 
entre as duas situações mencionadas a seguir. 
Por exemplo, se0<2z< 1a aresta que liga 
zag na Figura 7.2 não é nula, logo o sistema 
permanece estruturalmente observável tanto 
como para um sistema para o qual essa aresta 
tenha um peso constante (nesse caso seria re- 
presentado por uma seta cheia). Outros mé- 
todos, descritos neste capítulo, evitam essa 


dificuldade. 


Como consequência da não linearidade, 


há elementos não constantes em [(Df)":c] 
e, portanto, há arestas no grafo que podem 
se anular. Métodos para quantificar obser- 
vabilidade que tratam de arestas pontilha- 
das e contínuas da mesma maneira ignoram 
o efeito de não linearidade que é uma das 
principais causas do aparecimento de singu- 
laridades que, por sua vez, afetam a obser- 
vabilidade do sistema, como discutido na Se- 


ção dz: 


7.2.2 O método de Liu e colegas 


Um procedimento mais recente foi proposto 
por Liu e colegas (Liu et al., 2013). O mé- 
todo proposto busca determinar o menor nú- 
mero de nós sensores necessário para recons- 
truir o estado, ou seja, necessário para tor- 
nar o sistema observável. O primeiro passo é 
montar um diagrama de inferência, ou seja, 
um grafo. O grafo é decomposto em com- 
ponentes fortemente conectados (SCC do in- 
glês strongly connected components) que são 
os maiores subgrafos em que há caminhos di- 
retos de cada nó para qualquer outro nó. Um 
SCC que não tenha arestas entrando é cha- 
mado de um SCC raiz (Liu et al., 2013). O 
sistema é observável se ao menos um nó de 
cada SCC raiz é medido, ou seja, cada SCC 
raiz deve ter ao menos um nó sensor. 


Exemplo 7.2.2 


Começamos considerando o grafo mos- 
trado na Figura 7.3a, que corresponde ao 
sistema de Róssler (7.10), mas sem dis- 
tinguir entre linhas cheias e pontilhadas. 
Note que podemos começar por qualquer 
nó — que corresponde a uma variável — e 
chegar a todos os demais nós, seguindo a 
direção das setas. Portanto, todo o grafo 
é um SCC. Como não há arestas de en- 
trada, dizemos que é um SCC raiz. 

Para garantir a observabilidade, basta 
medir qualquer uma das variáveis. Con- 
tudo, se a aresta de x para z se anular, a 
variável z não mais é parte do SCC (veja 
Figura 7.3b) e não deve ser medida. As 
arestas que apontam de x para z, com 
peso z e de z para si mesma, com peso 
x — c, são o resultado da não linearidade 
na terceira equação do sistemas de Rós- 


sler. 

Deve ser notado que no grafo mos- 
trado na Figura 7.3b, o SCC não é raiz o 
que significa que mesmo que x ou y sejam 
medidos, o sistema não é observável. De 
fato, para z = (O sabemos que a matriz 
de observabilidade é singular neste caso. 
Mas mesmo que o caso extremo de z = 0 
não seja alcançado, a análise deste exem- 
plo sugere que medir x ou q é preferível 
a medir 2. 


V 


z 
Z 


FIGURA 7.3: Grafos para o sistema de Rôs- 
sler. (a) O SCC raiz, destacado dentro do 
traçado contínuo, contém as três variáveis 
quando todas as arestas são consideradas 
constantes, e (b) o SCC não é raiz e contém 
somente x e y quando as arestas vermelhas, 
de x para z e de z para z, são removidas. 
Fonte: (Aguirre et al., 2018). 


O Exemplo 7.2.2 mostra que o método 
de Liu e colegas, como reconhecido por eles 
(Liu et al., 2013, p. 2464), não é capaz de in- 
dicar que medir y é preferível a z, no caso 
do sistema de Róssler. Além disso, foi mos- 


trado que esse procedimento gráfico subes- 

tima quantas variáveis devem ser medidas 

(Haber et al., 2018; Letellier et al., 2018b). 

Uma versão melhorada desse procedimento 

gráfico foi proposto em (Letellier et al., 20184), 
que mostra que interações não lineares de- 

vem ser retiradas para determinar os SCOs e 

que o procedimento fornece condições neces- 

sárias, mas não suficientes para se garantir 

observabilidade estrutural. 


7.3 Observabilidade 
dinâmica 


Ao contrário da observabilidade estrutural, 
observabilidade dinâmica refere-se ao caso 
em que é possível quantificar de maneira 
“contínua” — ou seja, não de forma “binária” 
— a capacidade de estimar o estado de um 
sistema a partir de um conjunto finito de da- 


dos. Uma quantificação pode ser conseguida 
por meio de coeficientes de observabilidade, 
como discutido no restante do presente capí- 
tulo. 


É fundamental perceber que só faz sen- 
tido falar desse tipo de observabilidade para 
o caso de sistemas que são totalmente obser- 
váveis em geral, ou seja, são observáveis em 
todo o espaço a menos de uma variedade não 
observável. Essa variedade tipicamente tem 
dimensão menor que a dimensão do espaço 
de estados. Portanto, a observabilidade di- 
nâmica permite classificar pares observáveis 
[f, hi(a:)] em termos de qualidade, para um 
determinado campo vetorial f. 


Uma situação análoga, mas em termos de 
controlabilidade, foi relatada para redes com- 
plexas. Em particular, foi considerado o caso 
em que uma rede é controlável a partir de um 
certo conjunto de nós de controle, contudo, 
o controle é difícil de se alcançar na prática 


(Wang et al., 2017). Cowan e colaborado- 
res argumentaram que mais importante que 
as questões de controlabilidade estrutural é 
determinar se uma rede é “praticamente não 
controlável” (Cowan et al., 2012). Esse é a 
situação típica em que a avaliação de con- 
trolabilidade ou observabilidade dinâmica é 
preferível à estrutural. 


Para avaliar a observabilidade dinâmica é 
necessário enfrentar dois desafios. Primeiro, 
deve haver alguma medida de quão longe se 
está da região no espaço de estados em que o 
sistema perde observabilidade, ou seja, quando 
a matriz de observabilidade deixa de ter posto 
pleno. Segundo, como quantificar esse resul- 
tado em termos médios de forma a se ter um 
único coeficiente “global” que indique a obser- 
vabilidade. Uma forma de abordar esses de- 
safios é calculando-se alguma medida de con- 
dicionamento numérico e tomar a média ao 
longo de uma trajetória, que pode ser inter- 


pretada como uma média espacial no espaço 
de estados, como detalhado na Seção 7.3.1 


Outras maneiras de vencer o primeiro de- 
safio é usar o determinante ou os valores sin- 
gulares da matriz de observabilidade O ou de 
OO. Uma maneira interessante de abordar 
esse problema foi considerado em (Frunzete 
et al., 2012), onde foi quantificada a fração do 
tempo que a trajetória passa dentro de uma 
vizinhança da variedade singular, ou seja, a 
região no espaço em que a matriz de obser- 
vabilidade não tem posto pleno. 


Uma característica da maioria das medi- 
das de observabilidade dinâmica é que sua 
interpretação é apenas relativa. Ou seja, os 
coeficientes são eficazes para comparar pa- 
res [f,h;(x)] de um mesmo campo vetorial 
f, mas não para comparar sistemas diferen- 
tes em termos de observabilidade. Uma das 
razões para isso é que a determinação nu- 
mérica do posto de uma matriz é fortemente 


influenciada pela dimensão da matriz. Uma 
maneira de contornar esse problema é pelo 
uso dos coeficientes simbólicos de observabili- 
dade, mencionados brevemente na Seção 7.4. 
Antes, contudo, apresenta-se uma maneira 
de quantificar a observabilidade de um sis- 
tema. 


7.3.1 Classificação de 
pares observáveis 


No Exemplo 7.1.1 foi mostrado um caso em 
que a matriz de observabilidade é constante 
e não singular. É concebível haver sistemas 
com a mesma característica, mas para os quais 
a matriz de observabilidade apesar de cons- 
tante e não singular seja mal condicionada. 
Isso significa que a existência de um difeo- 
morfismo global apesar de implicar observa- 
bilidade, não garante “boa” observabilidade 
do ponto de vista numérico. Para investi- 


gar esse ponto de forma mais sistemática, 
percebe-se que é necessário ter uma “medida” 
de qualidade de observabilidade, mesmo para 
sistemas observáveis. Uma maneira de ava- 
liar essa qualidade é discutida na presente 
seção. 
Friedland definiu o coeficiente (Friedland, 
1975) 
mil OTO] | 
| Amax[O7O] | 


Ô (7.18) 
em que Amax[O”O| indica o máximo autova- 
lor de OTO (Amin é definido de forma aná- 
loga) para observabilidade de sistemas line- 
ares. Assim, mesmo para matrizes de obser- 
vabilidade de posto pleno, o coeficiente de 
observabilidade O < ó < 1 pode ser pequeno, 
indicando observabilidade “fraca”. Para um 
par [4,C] que não seja observável, ó = 0. 

A próxima observação diz respeito ao or- 
denamento de pares observáveis. 


Observação 7.3.1. Sejam os sistemas line- 
ares com uma saída para os quais c E IR” e 
a saída é s = c'x. Assim, faremos referên- 
cia à observabilidade do par [4,c”]. Sejam 
dois pares [4, cj] e [4,c3] com matrizes de 
observabilidade (veja Eq. 7.2) O, e Os, res- 
pectivamente, tais que p[01] = p[05] = n. 
Portanto, ambos os pares são completamente 
observáveis. Contudo, usando (7.18) obtém- 
se 0 < 6d < 6. Em tal situação, diz-se que 
[4, cf] é menos observável que [4,c5] ou, 
alternativamente que s, D sy, O que signi- 
fica que s, = cja (veja Eq. 7.1) proporciona 
pior observabilidade da dinâmica em A que 
S9 = G&. 

Observação 7.3.2. Um resultado análogo 


pode ser estabelecido para dois pares não li- 


neares [f, h1] e [f, ho). 


Observação 7.3.3. Portanto, os coeficien- 
tes de observabilidade ô podem ser utiliza- 
dos para ordenar dois pares com O, e ds,,, 


que são constantes e invertíveis. Isso significa 
que mesmo que haja difeomorfismos globais, 
um pode ser preferível ao outro em termos 
de observabilidade “numérica” ou “prática”. 
Se o espaço de reconstrução tiver dimensão 
n isso pode ser avaliado diretamente pela ex- 
pressão de Det ms que pode ser diferente de 
zero, mas muito pequeno no caso de uma va- 


riável que proporciona observabilidade fraca. 


Um exemplo da Observação 7.3.1 é forne- 
cido pela teoria de sistemas lineares pela qual 
sabe-se que transformações de similaridade 
entre sistemas de coordenadas não alteram 
o posto das matrizes de observabilidade de 
de controlabilidade (Chen, 1999). Foi mos- 
trado que ô em (7.18) e o coeficiente aná- 
logo para o caso de controlabilidade são sen- 
síveis a transformações de similaridade, pois, 
mesmo que o posto dos gramianos ou das ma- 
trizes de controlabilidade e observabildiade 
não mude, o condicionamento numérico em 


geral é diferente (Aguirre, 1995a). 

Seguindo as ideias em (Friedland, 1975; 
Aguirre, 1995a), o conceito da quantificação 
de variáveis em termos da observabilidade 
que elas fornecem do sistema foi adaptado 
para sistemas não lineares (Letellier et al., 
1998; Letellier e Aguirre, 2002). Em particu- 
lar, (7.18) foi estendido para: 


= | Amin [OT O, ,e(t)] | 
| Ama OO 6 


ôs(a) (7.19) 
A matriz de observabilidade Os(ax) foi origi- 
nalmente avaliada usando (7.2) com a ma- 
triz jacobiana Df(a) no lugar da matriz di- 
nâmica 4. Em trabalhos subsequentes, a 
matriz em Eq. (7.5) passou a ser avaliada ao 
longo de uma trajetória a(t), to < t< T 
tomando-se a média do índice (7.19) ao longo 
de e(t), ou seja 


1 


dg Ts [ ôs(a(T))dr, (7.20) 


em que T é o tempo final e o tempo inicial 
to > O é escolhido de maneira a evitar o efeito 
de transientes. Os coeficientes de observabili- 
dade para o sistema de Róssler são calculados 
no Exemplo 7.3.1. 


Exemplo 7.3.1 
Para o sistema de Róssler (7.10), a matriz 


de observabilidade a partir da variável z, 
O,(x), é (ver Exercício 7.5): 


z— o 2a) 


que não é constante. Como Det(O,) = 
— 2º se anula para z = 0 a dinâmica desse 
sistema não pode ser “vista” usando-se 
a variável z no espaço (z, 2, 2) quando o 
sistema original está no subespaço x = 
[, y,0|” chamado variedade singular de 


observabilidade (Frunzete et al., 2012). 
Portanto, O.(ax) tem posto deficiente no 
plano z = 0, sendo que próximo a esse 
plano o posto é praticamente deficiente. 
Usando O, (x) — ver (7.15) —, Os(x), que 
não é mostrada, e O,(a) — ver (7.21) — 
em (7.19) e calculando (7.20), os seguin- 
tes valores foram encontrados (Letellier 
ei lho 400 io ia = OPOR R = mini 
ô: = 0,006, portanto as variáveis do siste- 
mas de Róssler podem ser ordenadas do 
ponto de vista de observabilidade como 
tj [> gi 


7.3.2 Singularidades e falta 
de observabilidade 


Singularidades em O(x) indicam que o mapa 
entre o espaço de estados original e aquele 
usado para reconstruir a dinâmica não é glo- 


balmente invertível. Como ilustrado no Exem- 
plo 7.3.2, aumentando-se de. pode eliminar 
tais singularidades se o sistema for observá- 
vel. No caso de pares não observáveis, au- 
mentar d, não elimina as singularidades. Isso 
pode ser interpretado como a função de me- 
dição não ser genérica em termos do teorema 
de Takens. Diga-se de passagem, Takens as- 
sumiu que a função de medição é genérica, 
evitando assim problemas com singularida- 
des em dimensões mais elevadas. 


É conveniente distinguir entre singulari- 
dades “locais” e “globais”. Uma matriz de ob- 
servabilidade constante, mas com posto defi- 
ciente, O, tem uma singularidade global, pois 
é sempre de posto deficiente, independente de 
onde o sistema esteja no espaço de estados. 
Esse é o caso, por exemplo, de sistemas linea- 
res não observáveis. Por outro lado, para sis- 
temas não lineares, O(x) pode tornar-se de 
posto deficiente em certas regiões do espaço 


de estados. Por exemplo, O.(x) em (7.21) 
torna-se de posto deficiente em z = 0. A 
existência de singularidades locais é uma con- 
sequência de não linearidade. Um sistema 
com uma singularidade global na matriz de 
observabilidade é não observável. Isso não 
pode ser dito de um sistema cuja matriz de 
observabildiade tenha uma singularidade lo- 
cal. 

Portanto, observabilidade pode ser afe- 
tada por: i) a escolha de coordenadas do es- 
paço de reconstrução, e ii) a existência de 
singularidades e como a trajetória se rela- 
ciona com tais singularidades. O primeiro 
caso pode ocorrer tanto com sistemas linea- 
res (Aguirre, 1995a) como não lineares. O 
segundo caso ocorre somente com sistemas 
não lineares. 


Exemplo 7.3.2 


Se o atrator de Róssler for reconstruído 
em (2,24) 242) 2h em que 2) é a à- 
ésima derivada de z, o mapa correspon- 
dente é 94, em que o índice 4 indica a 
dimensão do espaço de reconstrução. No 
Exemplo 7.3.1 foi mostrado que a matriz 
de observabilidade no espaço de recons- 
trução 3D (2,28) ,2(2)) é de posto defici- 
ente quando avaliada sobre o plano sin- 
gular z = 0. Mas, ao aumentar a dimen- 
são do espaço de reconstrução para de = 
4, a matriz de observabilidade para z = 0 
torna-se (Aguirre e Letellier, 2005): 


z— 0 0 1 
oo! (9) 0 T— e 
—. = ; (722) 
da 2= 0 b 0 —y+ (x — co)? 
2b(x— c) —2b 44,3 


em que d43 = —3b-x—ay+(x—c)|-3y+ 
(x — c)2]. A matriz em (7.22) tem posto 
pleno de colunas. 

Portanto, dizemos que há uma imer- 


são do espaço original IR?(x,1, 2) para o 
reconstruído IR*(z, 2), 22), 2(8)), sendo 
que o sistema é observável a partir do 
espaço reconstruído. Alternativamente, 
pode-se dizer que há um difeomorfismo 
global do atrator em IRê(x,y,2) para 
aquele em IR“(z, 2), 22), 248)) — ambos 
os atratores têm a mesma dimensão. 
Contudo, isso foi alcançado aumentando- 
se a dimensão do espaço de reconstrução. 
Isso não foi necessário ao se usar a va- 
riável y. Assim, y fornece uma situação 
mais favorável que z em termos de obser- 
vabilidade, conforme quantificado pelos 
coeficientes de observabilidade. 


7.3.3 Métodos gráficos 


Métodos convenientes para avaliar e inter- 
pretar observabilidade podem ser desenvolvi- 
dos com o auxílio de procedimentos gráficos. 


Um procedimento foi proposto em (Letellier 
e Aguirre, 2005) que não fornece coeficientes 
numéricos, mas pode ser usado para elencar 
as variáveis de um sistema em termos da ob- 
servabilidade fornecida por cada uma. Esse 
ponto é interessante pois, há outros procedi- 
mentos gráficos que seguem a filosofia “biná- 
ria”, ou seja, só se preocupam em determinar 
se um par é observável ou não. 

O método descrito em (Letellier e Aguirre, 
2005) consiste em representar as variáveis de 
um único sistema dinâmico e a relação en- 
tre suas variáveis por meio de um grafo — 
como feito antes — no qual relações lineares 
e não lineares são indicadas por setas con- 
tínuas e pontilhadas, respectivamente, como 
ilustrado no próximo exemplo. 


Exemplo 7.3.3 


À primeira equação em (7.10) diz que as 
variáveis y e z agem de forma linear so- 
bre x. Assim, setas dos vértices y e z 
apontam para «x por meio de linhas con- 
tínuas. A segunda e terceira equações 
podem ser interpretadas de maneira aná- 
loga. O grafo completo está mostrado na 
Figura 7.4a. A seta contínua que aponta 
para z representa a constante b. Esse 
grafo é desenhado exclusivamente a par- 
tir das equações (7.10), independente de 
qual seja a variável medida s(t). 

Do grafo em Fig7.4a, um esquema 
detalhado (Fig 7.4b) é construído assu- 
mindo que cada variável é medida uma 
de cada vez, ou seja, s(t) = 1,y,2. Isso 
é feito para realçar as diferenças entre as 
variáveis no que tange à observabilidade. 
Para isso, o esquema detalhado é obtido 
visitando-se as variáveis a partir da va- 


riável medida s(t) e movendo-se na di- 
reção oposta às setas. Cada coluna na 
Figura 7.4b corresponde a uma dimen- 
são a mais no espaço de imersão, ou re- 
construção. Por exemplo, quando y(t) é 
medida, ou seja s(t) = y(t), essa variável 
é a primeira coordenada. A segunda e 
terceira coordenadas são y e 1, respecti- 
vamente. Começando no nodo y (a pri- 
meira coordenada), avançamos um passo 
contra a direção das setas para produzir 
y (a segunda coordenada). Como a seta é 
contínua e termina em x (Fig 7.4a), usa- 
se uma conexão contínua na Figura 7.4b 
entre y e x, e assim por diante. 


FIGURA 7.4: Análise gráfica de observabi- 
lidade do sistema de Róssler. (a) Grafo da 
relação entre as variáveis do sistema de Rós- 
sler. Setas contínuas (tracejadas) represen- 
tam acoplamentos (não) lineares. (b) Dia- 
grama esquemático da relação entre as va- 
riáveis e as duas primeiras derivadas suces- 
sivas. Fonte: (Aguirre et al., 2018). 


Como setas contínuas representam re- 
lações lineares, quando as três variáveis 
(x,y, 2) forem conectadas horizontalmente 
por setas contínuas, há um difeomorfismo 


global. Isso ocorre porque as conexões 
permanecem e tem-se em 3D a informa- 
ção sobre todas as variáveis do espaço 
original. Portanto na Figura 7.4b pode 
ser visto que o único difeomorfismo glo- 
bal ocorre entre o espaço de estados ori- 
ginal e o espaço de reconstrução (y, 1), 1). 
Compare isso ao caso em que surgem se- 
tas tracejadas, que se relacionam a singu- 
laridades no mapa do espaço original e o 
de imersão. Quanto antes aparecerem as 
setas tracejadas no esquema detalhados, 
tanto pior é do ponto de vista de obser- 
vabilidade. Assim, quando a variável x 
é medida, setas tracejadas aparecem so- 
mente no último estágio, conectando i a 
x, enquanto que para a variável z, setas 
tracejadas aparecem logo no primeiro es- 
tágio. Como consequência, z resulta em 
pior observabilidade da dinâmica do sis- 
tema que z, ou seja, vD xD 2. 


7.4 Observabilidade Simbó- 
lica 


Observabilidade simbólica compartilha algu- 
mas características com os outros tipos de 
observabilidade. Note-se que não se trata 
de uma outra forma de observabilidade, mas 
de uma outra maneira de quantificar e com- 
parar a obsevabiliadade de pares observáveis 
[f,hi(a)]. A observabilidade simbólica tem 
algumas características próprias, como men- 
cionado nesta seção. Por um lado, assim 
como ocorre com a observabiidade estrutu- 
ral, a observabilidade simbólica não depende 
dos valores de parâmetros, mas somente dos 
termos não lineares das equações. Por ou- 
tro lado, assim como a observabilidade dinã- 
mica, é possível classificarmos pares observá- 
veis [f, h;(a:)| usando conceitos de observabi- 
lidade simbólica. 


Um ponto central na definição dos coefici- 


entes simbólicos de observabilidade é a com- 
plexidade das singularidades que aparecem 
na matriz de observabilidade simbólica. Al- 
gumas das vantagens do procedimento sim- 
bólico incluem: é mais fácil de aplicar em 
sistemas de ordem mais elevada e de comple- 
xidade maior (Bianco-Martinez et al., 2015) 
inclusive no caso de redes com uma ou duas 
dezenas de nós (Letellier et al., 2018b), for- 
nece resultados “normalizados” na faixa [0; 1] 
o que permite comparar sistemas diferentes 
em termos de observabilidade. Relacionado 
a isso, foi observado que sistemas com coefi- 
cientes de observabilidade simbólica maiores 
que 0,75 de modo geral indicam boas propri- 
edades do ponto de vista de observabilidade 
(Sendifa-Nadal et al., 2016). 


7.4.1 Coeficientes de observabi- 


lidade simbólica 


Os principais passos para calcular os coefici- 
entes de observabilidade simbólica são: 


1. obter a matriz jacobiana simbólica NÃ 
a partir da matriz jacobiana clássica, 
substituindo elementos constantes, não 
constantes polinomiais e racionais por 
1, 1, e 1, respectivamente; 


2. construir a matriz de observabilidade 
simbólica O como detalhado depois; 


3. calcular a expressão simbólica de Det [O] 
e contar o número de termos simbólicos 
em tal expressão; 


4. por fim, o coeficiente de observabili- 


dade simbólica é obtido calculando: 


N ] 
NM +Ni+ No 
Ni 
(max(N1,1) + Nj + Ny? 
i 
(max(N1,1) + Nj + Ny” 
(7.23) 


Mh = 


em que Ni, Nj e N; são os números de 
termos simbólicos 1, 1 e 1, respectiva- 
mente. 


A seguir são descritos os passos para de- 
terminação de Ó (Bianco-Martinez et al, 
2015). A primeira linha de Ó indica a única 
variável medida. Portanto, supondo que a j- 
ésima variável é medida, a primeira linha de 
Ó será composta de zeros e de um 1 na j- 
ésima posição. A segunda linha de Ô é igual 
à j-ésima linha da matriz jacobiana simbólica 


TJ. A k-ésima linha de Ô é obtida como se se- 
gue: transponha a linha k — 1 de Ô, ou seja, 
a última linha formada, e multiplique cada 
elemento Ti da matriz jacobiana simbólica 
Ná pelo 2-ésimo elemento da linha k — 1 de Ó 
que foi transposta, produzindo uma matriz 
auxiliar J'. Essa multiplicação deve seguir a 
seguinte regra (Bianco-Martinez et al., 2015): 


0 & Jj=0, 
69 Ti = Tiso 
. [Os fg=0 
| dy q Isedy= 
1 outro 
= > O seJ; =0 
SED agia À 1 o ao 


Por fim, a k-ésima linha de O é obtida 
somando os elementos da mesma coluna da 
matriz auxiliar J'. Essa soma deve seguir a 


seguinte regra (Bianco-Martinez et al., 2015): 


0 


1 


1 


i 


> 1 
d= (5, 
, i 
4-1 a, 
Ts VT. 


se di = 0 
outro 

se Ti for O ou 1 
outro 


(7.25) 


A seguir é apresentado um exemplo de 
como determinar os coeficientes para a quan- 
tificação simbólica da observabilidade. 


Exemplo 7.4.1 


Para o sistema de Róssler (7.10), as ma- 
trizes jacobianas clássica e simbólica são 


dadas respectivamente por: 


0 —1 —1 011 
Df=|1 a 0 e Rg 

= Oia) Rg 
(7.26) 


Note que 7 pode ser obtida de Df 
por inspeção. Se a variável medida for x, 
a primeira linha de O, será 


pio 
A segunda linha de Ó. será a primeira 
linha de Y porque é a primeira variável 
de estado que é medida, portanto: 


[Rr (2) 


Para obter a terceira linha de om começa- 


se transpondo a linha em (7.27) e multiplica- 


se cada elemento desse novo vetor por 


cada elemento da linha correspondente 
em J usando a regra em (7.24), o que 
resulta em: 


cujo resultado é a matriz auxiliar NE . Por 
fim, a terceira linha da matriz de obser- 
vabilidade simbólica é obtida somando os 
elementos, por coluna de J, de acordo 
com a regra em (7.25), o que resulta em: 


EE 


Portanto, a respectiva matriz de ob- 
servabilidade é (Bianco-Martinez et al., 


0 
1 
1 


(7.28) 


GS: 

8 

II 
HIO 
HIH O 


cujo determinante simbólico é Det[Ô,] = 
1I9(191-181). Nessa expressão há 
quatro Is e um 1, logo N; = 4, Nj = 
1e N; = 0. Usando esses valores em 
(7.23) chega-se a n,3 = 0,84. De ma- 
neira análoga é possível obter (Bianco- 
Mantimeziet alo oia des 
0,56, em que o expoente mostra a di- 
mensão do espaço de reconstrução (veja 
Exemplo 7.3.2 e Exercício 7.6). Sendo 
assim as variáveis podem ser ordenadas 
como antes: yD x D 2. 


7.5 Observabilidade a Par- 
tir de Dados 


Nesta seção ainda consideramos o sistema 
x = f(a), f: Rº > Rº do qual mede-se 
uma grandeza escalar s(t) = h(x), h: IR” > 
IR. Um vetor em d. coordenadas diferenciais 
pode ser escrito como: 


sT(1)= [s(t) a(t) s(t) ... se D(6)], (7.29) 


em que s(d-1(t) indica d(de-Ds(t) /dtlde-D, 
ou seja a (de—1)-ésima derivada temporal de 
s(t). Semelhantemente, um vetor em de co- 
ordenadas de atraso é representado como: 


sk = [s(k) s(k+7) s(k+27) ... 
co s(k+(de—1)7)], (7.30) 


em que s(k) é o k-ésimo valor de s(t) amos- 
trado com período de amostragem T., ou seja, 
s(k) = s(kT;). Para não carregar a nomen- 
clatura, usamos (-) tanto para o caso em tempo 


contínuo, ver Eg. 7.29, como para o caso em 
tempo discreto, como por exemplo em (7.30), 
em que 7 é o tempo de atraso; e usamos d no 
lugar de de. Uma matriz de trajetórias é de- 
finida como (Broomhead e King, 1986): 


rosT 
Sk+1 
X = : 
LEBeusid 
s(k) s(k+7) Ee s(k+(d-—1)7T) 
s(k+1) s(k+1+7) SS s(k+1+(d—1)7) 
Ls(k+N-1) s(RAN-1+7) E SBAN-I+(d= 17) | 


A matriz de trajetória X E IRÍX! N >d 
pode ser decomposta usando valores singula- 
res como: 


X= SEC”, (7.31) 


em que S e C são matrizes ortogonais e 3 é 
uma matriz diagonal contendo os valores sin- 
gulares de X, ou seja, D = diaglo1,...,0al, 
sendo 0, > 02 >... > oq. À relação (7.31) é 
conhecida como a decomposição em valores 


singulares, ou SVD (do inglês singular value 
decomposition). 

No que se segue, assume-se que os dados 
no espaço de estados original x encontram-se 
sobre uma variedade com dimensão m < n. 
Para uma função de medição genérica h há 
um difeomorfismo entre os espaços original e 
de imersão se d > 2m + 1 (Takens, 1981). 
Além disso, se somente d' < d valores sin- 
gulares forem maiores que zero, ou maiores 
que o ruído de fundo no caso de dados ruido- 
sos, os primeiros d” vetores em CU podem ser 
usados como coordenadas de um espaço de 
reconstrução de dimensão reduzida d' (Bro- 
omhead e King, 1986). 


7.5.1 Medidas locais de “simpli- 
cidade” 


Em um bom espaço de reconstrução a diná- 
mica do sistema original é bem representada. 


Começamos com um sistema de coordenadas 
diferenciais, ver (7.29), depois são considera- 
das coordenadas de atraso. 


Quando a variável medida s(t) não pro- 
porciona boa observabilidade, normalmente é 
possível encontrar no espaço de imersão (re- 
construído) regiões em que a trajetória está 
espremida ou retorcida. Muitas vezes, em 
tais regiões, não há sequer um difeomorfismo 
local entre o espaço original e o reconstruído. 
Por outro lado, quando s(t) proporciona boa 
observabilidade, o atrator fica bem represen- 
tado. Dizemos que o atrator está “desdo- 
brado” ou “expandido” adequadamente, o que 
contrasta com os adjetivos “espremido” e “re- 
torcido”. 


Nesta seção deseja-se quantificar o “des- 
dobramento” local de uma trajetória sobre o 
atrator. Conjectura-se que se a trajetória es- 
tiver bem desdobrada em uma região U, a 
correspondente geometria deve ser simples, o 


que é caracterizado pelo maior valor singu- 
lar oc, de uma matriz construída com dados 
em U ser significativamente maior que os de- 
mais. Por outro lado, quando a trajetória 
estiver espremida e retorcida no espaço de 
imersão, a estrutura local do atrator torna- 
se mais complicada, o que se reflete em ou- 
tros valores singulares ficarem relativamente 
mais importantes. Portanto, uma indicação 
da simplicidade geométrica da trajetória em 
U é dada por (Aguirre e Letellier, 2011): 


o 
ci) = - 


en 100, (7.32) 


em que Tr[D] é o traço da matriz 5, ou seja, 
a soma de todos os valores singulares 0;, à = 
1,...,d e cyy(U) é uma medida relativa do 
maior valor singular de uma matriz construída 
com dados tomados em YU. Assim, valores 
grandes de o1y% indicam que não há torções 
ou dobras fortes em U, o que caracteriza uma 
trajetória bem “desdobrada”. Por outro lado, 


à medida que o sistema visita regiões em que 
há torções e a trajetória é espremida, cy é 
menor em tais regiões. Do ponto de vista da 
reconstrução, quanto maior o1y%, melhor. 


Portanto, a ideia central do método é que 
se há regiões com torções ou dobras resul- 
tantes do uso de uma variável s(t) que pro- 
porciona baixa observabilidade da dinâmica, 
essa situação é detectada por uma redução de 
c1%. Uma marca de uma boa reconstrução 
é homogeneidade. Assim, características do 
espaço de imersão podem ser quantificadas 
pela variabilidade de c,% ao longo do espaço. 
Outras medidas de homogeneidade existem 
para determinar falta de causalidade (Buzug 
e Pfister, 19924). 


O procedimento consiste de tomar uma 
serie temporal s e realizar a imersão usando 
algum conjunto de coordenadas. Escolhe-se 
um certo número de vizinhanças espalhadas 
ao longo do atrator no espaço reconstruído 


e, para cada vizinhança, calcula-se oc1%. Por 
fim, determina-se a estatística 


= mean(oix(U)) 
“100 x std(oiy(U)) 


(7.33) 


“mean” e “std” são a média e desvio padrão 
amostral de c1% calculadas sobre o conjunto 
de vizinhanças U. A conjectura por trás do 
uso de (7.33) é que valores médios de cy 
grandes indicam um melhor “desdobramento” 
da trajetória. Além disso, uma menor vari- 
abilidade de ci, quantificada por std(oi%), 
indica um espaço reconstruído mais homo- 
gêneo, que também é característico de uma 
reconstrução usando uma variável que pro- 
porciona boa observabilidade. 

Sejam s4, s> E IR dois vetores no espaço 
reconstruído IRº. Esses vetores são vizinhos, 
com tolerância e, se |sy — 89| < 6, em que 
| - | indica alguma norma. Nos exemplos a 
seguir usamos a norma Ly. Uma vizinhança 


U pode ser definida tomando algum vetor de 
referência s, € Rº e procurar todos os ve- 
tores nos dados que satisfaçam a condição 
|sr— s;| < €, Yi. Suponha que para um de- 
terminado vetor de referência s, os vetores 
8; 4 = J1,)2,-.., Jn estão dentro da vizi- 
nhança delimitada por e, indicada por U. A 
matriz de dados local para U é formada por: 


)2 
Xu(S:, €) = E l (7.34) 
Sjw 
Na prática, as regiões U em que cy é calcu- 
lado, não devem ser muito pequenas. Omi- 
timos os argumentos de Xy(s,,€) para não 
sobrecarregar a nomenclatura. 


A decomposição da matriz local é dada 
por (ver Eq. 7.31) 


Xy= 550"; (7.35) 


e os elementos de X são usados em (7.32). 

A Eq. 7.33, é relevante em problemas de 
observabilidade, pois o uso de variáveis que 
proporcionam baixa observabilidade resulta 
em “pontos cegos” no espaço reconstruído. 
Essas regiões normalmente são caracteriza- 
das por fortes dobras e torções da trajetória, 
ou seja, localmente se desviam de compor- 
tamento linear. Esses desvios são captura- 
dos por S,, que foi denominada estatística 
SVDO, do inglês singular value decomposi- 
tion observability. 


Exemplo 7.5.1 


Este exemplo considera o sistema de 
Róssler com parâmetros (a,b,c) = 
(0,398, 2,0,4,0). O objetivo é ilustrar os 
principais aspectos do método apresen- 
tado nesta seção. Detalhes do experi- 
mento numérico podem ser encontrados 


em (Aguirre e Letellier, 2011). 

Toma-se uma trajetória sobre o atra- 
tor, ou seja, sem considerar efeitos tran- 
sientes e realiza-se a imersão no espaço de 
coordenadas diferenciais (wy, 1), ) a partir 
do registro da variável y, ou seja, s(t) = 
y(t). Dez por cento dos vetores no es- 
paço de imersão foram aleatoriamente es- 
colhidos para serem os vetores de refe- 
rência s,. Para cada um desses vetores 
foi construída a matriz de vizinhos Xy 
(veja Eq. 7.34) com e igual a 10% da má- 
xima excursão da variável usada. Por sua 
vez, cada uma dessas matrizes foi subme- 
tida à decomposição SVD (7.35) e cx 
em (7.32) foi determinado para cada ma- 
triz Xy a partir de seus valores singu- 
lares. Note que c1% é uma medida da 
estrutura geométrica do espaço de imer- 
são na vizinhança do respectivo vetor de 
referência. 


A Figura 7.5 mostra os valores calcu- 
lados de cy para 150 vetores de referên- 
cia tomados na sequência em que são per- 
corridos pela trajetória sobre o atrator de 
Róssler. Valores maiores correspondem a 
geometrias locais mais simples. Os picos 
negativos indicam regiões em que a geo- 
metria é mais complicada. Para enxergar 
isso melhor, dois vetores de referência são 
indicados na Figura 7.5. O que está si- 
nalizado com um círculo corresponde a 
uma região com estrutura geométrica lo- 
cal mais complicada e um quadrado, re- 
lativo a uma região de geometria mais 
simples. Isso pode ser constatado obser- 
vando as respectivas vizinhanças mostra- 
das na Figura 7.6. 

Até aqui não foi mencionado como 
foi escolhida a tolerância e. A fim de 
verificar a influência desse parâmetro o 
mesmo foi variado na faixa 1%A, < es < 


15%As, As = max(s)—min(s), e os resul- 
tados mostrados na Figura T.7a. Neste 
exemplo ÃO =894 A, = (UeAS- 
5,72. Problemas numéricos resultantes 
do uso de valores pequenos de e podem 
ser minimizados aumentando-se o tama- 
nho do registro de dados. Deve ser no- 
tado que a ordem das variáveis em ter- 
mos de observabilidade não foi afetada 
pelo valor de e. 


0 50 100 150 


reference vector number 


FIGURA 7.5: cy para 150 vizinhanças so- 
bre o atrator de Róssler reconstruído usando 
a variável y. O 9º vetor de referência está 
indicado com círculo e o 75º vetor de refe- 


rência, com um quadrado. Fonte: (Aguirre 
e Letellier, 2011). 


Vizinhança do 
2 vetor de referência 9 


vetor de referência 75 


f); / Vizinhança do 


ayldt E o SA : 
FIGURA 7.6: Atrator de Róssler recons- 
truído em coordenadas diferenciais usando 
a variável y. À estrutura geométrica na vi- 
zinhança do 75º vetor de referência é mais 
simples que a correspondente à vizinhança 
do 9º vetor de referência. Fonte: (Aguirre e 
Letellier, 2011). 


Figura 7.7b mostra que o período 
de amostragem praticamente não tem 
influência sobre o cálculo dos índices 
SVDO dentro da faixa avaliada. Assim 


para e, = 10% e T, = 0,07 os valores 
obtidos foram: S, = 0.24, S, — 0.29 e 
S. = 0.07. Portanto a ordem das va- 
riáveis em termos de observabilidade é 
ybaxbDz,o que coincide com outros mé- 
todos. 


] (a) 
20.5 E = 
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E% 
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b 
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período de amostragem 


FIGURA 7.7: Índices SVDO para o sistema 
de Róssler em função (a) da tolerância e 
(com T; = 0,07) e (b) do tempo de amostra- 
gem (com e= 10%). (Jx, (--)ye(--) 2. 
Fonte: (Aguirre e Letellier, 2011). 


Exemplo 7.5.2 


Este exemplo considera o sistema “corda” 
(Aguirre e Letellier, 2011): 


t=-y-z-arx+ar 
y =vy-—-baz—-y+G WAR) 
2 =bry+rz—as, 


com (9,b, FG) = (0.25,4.0,8.0, 10). À 
semelhança do que foi feito para o sis- 
tema de Róssler, a Figura 7.8 mostra o 
atrator corda. À parte ao fundo do atra- 
tor tem estrutura geométrica simples, ao 
passo de que a estrutura local da corda 
é bem mais complicada. Essa constata- 
ção é confirmada pelos valores de cy, 
estimados para vizinhanças de vetores 
de referência tomados aleatoriamente ao 
longo de uma trajetória, mostrados na 
Figura 7.9. 


30 


20 


FIGURA 7.8: Projeção bidimensional do 
atrator corda (7.36). No centro da figura, na 
corda, a trajetória é espremida em uma re- 
gião muito estreita. Os quadrados ao fundo 
do atrator são alguns vetores vizinhos do ve- 
tor de referência 36. O valor de cy corres- 
pondente é grande. Os círculos no centro 
da corda são vizinhos do vetor de referên- 
cia 51. O valor de cy correspondente é 
um dos mais baixos (ver Figura 7.9). Fonte: 
(Aguirre e Letellier, 2011). 


Os valores dos índices SVDO para 
este exemplo foram S, = 0,20, 5, — 0,05 
e 8, = 0,13, indicando que o espaço 
de imersão tem melhores características 
quando reconstruído pela variável x, se- 
guido de z e, por fim, y. Uma investiga- 
ção teórica da observabilidade desse sis- 
tema a partir das três variáveis resulta na 
ordem x by = z. Assim, a melhor obser- 
vabilidade da dinâmica do atrator a par- 
tir da variável x é confirmada. Contudo, 
ao passo que a análise de observabilidade 
a partir das equações indica que o desem- 
penho de y e de z é próximo, no caso dos 
índices SVDO a indicação é que z é me- 
lhor que y. Este exemplo, portanto, serve 
para lembrar que a análise de observabili- 
dade, por definição, requer equações. Por 
outro lado, os índices SVDO quantificam 
a qualidade do espaço reconstruído, que é 
fortemente influenciada pelas caracterís- 


ticas da observabilidade, mas não é uma 
medida direta desta. A Tabela 7.1 apre- 
senta os índices de alguns atratores co- 
nhecidos. 
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reference vector number 


FIGURA 7.9: oiy para 150 vizinhanças 


sobre o atrator do sistema (7.36). O qua- 
drado corresponde à parte do atrator com 


geometria local mais simples. Os triângu- 


los correspondem às extremidades da corda, 
e o círculo, ao centro, onde a geometria é 


mais complicada. Fonte: (Aguirre e Letel- 
lier, 2011). 


sistema, ordem de s Ss 
observabilidade 
y 0,29 0,02 
Róssler yvDrDz logio Z 0,25 + 0,03 
Ee 0,24 + 0,01 
z 0,07 + 0,002 
Z 2,23 E 0,13 
Lorenz zbrDby £ 0,96 + 0,38 
y 0,43 + 0,09 
T J 75 + 0,22 
Dupla-volta vDzDy z 0,37 + 0,08 
y 0,54 + 0,14 
z 0,44 0,03 
Lorenz'84 LDymZ y 0,25 + 0,02 
z 0,18 + 0,02 
T 0,20 + 0,04 
Atrator corda LDymz y 0,05 + 0,003 
z 0,13 + 0,01 


Tabela 7.1: A coluna “ordem de observabili- 
dade” foi determinada usando os coeficientes sim- 
bólicos de observabilidade (Letellier e Aguirre, 
2009). Os índices SVDO Ss, foram obtidos 
usando Eg. 7.33 com coordenadas diferenciais e 
100 simulações Monte Carlo sem ruído nos da- 
dos. As condições iniciais é que foram tomadas 
de maneira aleatória. Fonte: (Aguirre e Letel- 
lier, 2011). 


sistema ordem de 5 SvDOs com ruído (%) 


observab. 10% 
T U.64 0,45 = 0,05 
Róssler yvDrDz y 0,64 0,46 + 0,04 
logio Z 0,53 0,49 + 0,04 
z 0,21 0,19 + 0,01 
Z Tão 106 0,10 
Lorenz zDrxDy x 0,20 0,13 + 0,02 
y 0,13 0,09 + 0,01 
T U,76 U,71 E 0,08 
Dupla-volta vDbzDy z 0,47 0,52 + 0,07 
y 0,40 0,31 + 0,04 
T U,73 
Lorenz'84 TDYymSZ y 0,55 
z 0,55 
T 
Corda TDYUSZ y 
z 


Tabela TD: Índice SVDO calculado com a Eq.7.33 e coorde- 
nadas de atraso em 100 realizações de Monte Carlo. Em cada, uma 


realização diferente de ruído aditivo foi usada. O nível percentual de 


std(e) 
std(s) 


ruído é dado por x 100. As condições iniciais foram tomadas de 
maneira aleatória. (*) Os resultados para o sistema Lorenz'84 com 10% 
de ruído são dados para «e = 15%, em todos os demais casos e = 10%. 
A coluna “ordem de observabilidade' foi determinada usando os coefi- 


cientes simbólicos de observabilidade definidos em (Letellier e Aguirre, 


2009). Fonte: (Aguirre e Letellier, 2011). 


Leitura Recomendada 


A observação de que reconstruir o espaço de 
estados a partir de uma variável em vez de 
outra poderia ser mais (ou menos) fácil foi 
colocada de forma mais contundente a par- 
tir do fim da década de 1990 (Letellier et al., 
1998). Essa observação foi quantificada uti- 
lizando conceitos discutidos um pouco an- 
tes em (Aguirre, 1995a). No início da dé- 
cada Casdagli e colegas haviam mencionado 
brevemente algo relacionado (Casdagli et al., 
1991). Os principais pontos de duas décadas 
de resultados pelo autor e colegas foram re- 
visados em (Aguirre et al., 2018). O presente 
capítulo foi escrito com base nesse artigo. 


No contexto de redes, Sun e Motter cha- 
maram atenção para o fato de que mesmo 
para redes totalmente controláveis a im- 
plementação prática de controladores pode 
ser virtualmente impossível devido a mal- 


condicionamento numérico (Sun e Motter, 
2013). Um bom desafio parece ser a quantifi- 
cação desse condicionamento, especialmente 
para sistemas de dimensão alta, pois mesmo 
para sistemas de dimensão moderada, a de- 
terminação de coeficientes de observabilidade 
e controlabildiade não parece factível. 


No contexto de redes, um algoritmo para 
determinar se um conjunto de nós sensores 
provê observabilidade (estrutural) foi proposto 
em (Liu et al., 2013). Esse procedimento foi 
alterado usando argumentos de observabili- 
dade dinâmica em (Letellier et al., 20184). O 
uso de conceitos de observabilidade simbólica 
no contexto de redes dinâmicas foi abordado 
em (Letellier et al., 2018b). Observabilidade 
dinâmica foi investigada no contexto de redes 
com osciladores Fitzhugh-Nagumo em cada 
um dos três nós em (Whalen et al., 2015). 


Uma revisão crítica de observabilidade em 
redes pode ser encontrada em (Montanari e 


Aguirre, 2020) e o interessante conceito de 
observabilidade funcional foi discutido e adap- 
tado para aplicação em redes dinâmicas em 
(Montanari, 2021; Montanari et al., 2022). 


Exercícios 


7.1. Considere um sistema linear autônomo, 
x = Ax com equação de saída s = Cx. Mos- 
tre que a matriz de observabilidade é o mapa 
entre o espaço original com coordenadas x E 
IR” e o espaço reconstruído (s, 8, ..., s(M-1). 


7.2. Por praticidade, chamemos 
Ses as a) 


o conjunto de coordenadas diferenciais. Mos- 
tre que a matriz de observabilidade é OS /dx, 
tanto para o caso linear como para o não li- 
near. 


7.3. Derive a matriz de observabilidade em 


(7.15). 


7.4. Econtre a matriz de observabilidade 
do par [4,C] em (7.16) e confirme que não é 
estruturalmente observável. 


7.5. Derive a matriz de observabilidade para 
o sistema de Róssler quando a variável z é 
medida, ou seja, encontre (7.21). 


7.6. Volte ao Exemplo 7.4.1 e derive, passo 
a passo, os valores de coeficientes simbólicos 
de observabilidade: m,3 = 1 e n,3 = 0,56. 


Capítulo 8 


Caracterização de 
Séries Temporais 


O título deste capítulo pode causar uma certa 
estranheza ao leitor mais atento, posto que o 
Capítulo 5 tratou da caracterização de atra- 
tores. Essa estranheza, se experimentada, 
tem sua origem na aparente redundância en- 
tre os assuntos, pois uma série temporal pode 


ser representada em um espaço de imersão 
(ver Capítulo 6) se a série temporal for es- 
tacionária, em outras palavras, se a dinã- 
mica subjacente aos dados não variar com o 
tempo. Nesse caso, ao fazer a imersão obtém- 
se um atrator que é o comportamento em es- 
tado estacionário do sistema investigado. Se 
a série temporal, por outro lado, não for es- 
tacionária, ao fazer a imersão não se tem um 
atrator, por definição. 


Essa breve discussão aponta para as di- 
ferenças entre o presente capítulo e o Capí- 
tulo 5. Do ponto de vista conceitual, o pre- 
sente capítulo é mais fundamental que o ca- 
pítulo anterior. À razão de colocarmos o pre- 
sente capítulo após a caracterização de atra- 
tores é o fato de que, historicamente, as fer- 
ramentas a serem descritas aqui são mais re- 
centes. Assim, para se ter um contexto mais 
adequado na leitura do presente capítulo e 
perceber sua conexão com o Capítulo 5, a 


seguir é apresentada uma breve nota histó- 
rica. 


Conforme visto no o Capítulo 5, a década 
de 1980 foi muito especial para a área de sis- 
temas dinâmicos não lineares. Logo no início 
da década, Packard, Crutchfield, Farmer e 
Shaw publicaram um influente artigo no qual 
observaram que projeções de atratores estra- 
nhos nos espaços de imersão e original eram 
“parecidos” (Packard et al., 1980). Esses au- 
tores tanto consideraram o espaço de imersão 
usando coordenadas diferenciais como coor- 
denadas de atraso. Nesse mesmo ano, em 
Warwick, na Inglaterra, foi realizado um sim- 
pósio sobre sistemas dinâmicos e turbulência. 
Os anais desse evento foram publicados pela 
Springer como o volume 898 da série cha- 
mada Lecture Notes in Mathematics. Nes- 
ses anais foram publicados dois artigos, um 
por um matemático holandês Floris Takens 
(Takens, 1981) e outro por um matemático 


uruguaio, que estudou no IMPA, no Rio de 
Janeiro, Ricardo Mané (Mané, 1981). Nes- 
ses artigos, consta a formalização das obser- 
vações de Packard e seus colegas. Em parti- 
cular, Takens mostrou que para uma função 
de medição genérica h, é possível reconstruir 
um atrator com dimensão de contagem de 
caixas Do a partir de uma única série tempo- 
rals = h(ax), desde que o espaço reconstruído 
tenha dimensão de > 2Do,+1. Há autores que 
relatam o resultado de Takens usando outras 
medidas de dimensão, como a de correlação 
Ds. Como a diferença entre essas medidas é 
pequena, não há implicações de ordem prá- 
tica. 


O artigo de Takens (o de Mafé é muito 
menos conhecido e referenciado) é a “permis- 
são” para analizar sistemas dinâmicos não Ii- 
neares a partir de uma única grandeza me- 
dida. Como esses matemáticos considera- 
vam que a série de dados s(t) é infinitamente 


longa e sem ruído, a influência da função A, 
ou seja, o que se registra para analisar o sis- 
tema, não tem maiores repercussões. Con- 
tudo, como investigado no Capítulo 7, na 
prática, pode ser mais conveniente analisar 
um sistema a partir de uma grandeza, ao in- 
vés de outra. Passaram-se mais quinze anos 
até que o problema de observabilidade come- 
çasse a ser considerado de maneira sistemá- 
tica na comunidade. 


O fato é que a partir dos artigos de Pac- 
kard e colegas, e de Takens e Mané, houve 
um claro esforço para desenvolver algoritmos 
para caracterizar atratores a partir de séries 
temporais, entre eles podemos citar, a dimen- 
são de correlação (Grassberger e Procaccia, 
1983b; Grassberger e Procaccia, 19834) e os 
expoentes de Liapunov (Eckmann e Ruelle, 
1985; Wolf et al., 1985). Concomitantemente 
ao desenvolvimento de algoritmos de carac- 
terização surgiram aplicações. O uso de com- 


putadores pessoais começava a se difundir e 
coletas de dados em laboratório deixavam de 
ser exclusividade de alguns poucos grupos. 
O número e a variedade de aplicações “explo- 
diu”, mas, em muitos casos, sem o cuidado de 
verificar se as hipóteses feitas pelos referidos 
algoritmos eram satisfeitas. 

Coube a alguém com a envergadura ci- 
entífica de David Ruelle chamar a atenção 
para certos descuidos nos seguintes termos: 
“Direcionamos também atenção ao excessivo 
otimismo de algumas aplicações atuais” (Ru- 
elle, 1990).! 


IO artigo fora originalmente apresentado em 23 
de outubro de 1989 na forma de uma palestra, na 
série “Claude Bernard Lecture”. Juntamente com a 
“Humphry Davy Lecture” essas palestras foram cri- 
adas em um acordo entre a Royal Society e a Aca- 
demia de Ciências da França em 1984. A palestra 
Claude Bernard era ministrada uma vez por ano por 
algum cientista francês de renome, em visita ao Reino 
Unido. Em 1989 foi a vez de David Ruelle minstrar 


Considerando a dimensão de correlação 
(Grassberger e Procaccia, 1983b), Ruelle ar- 
gumentou que “não devemos crer em esti- 
mativas de dimensão que não estejam bem 
abaixo de 2l0g,9 N, sendo N o comprimento 
do registro de dados. Uma maneira um 
pouco mais útil de entender esse resultado 
é que, se tomarmos uma série temporal es- 
tocástica de comprimento N, o algoritmo de 
Grassberger-Procaccia satura em valor pró- 
ximo a 2log,,N. Ou seja, para reivindi- 
car a presença de dinâmica determinística de 
baixa dimensão, a estimativa dessa grandeza 
deve ser “Pem menor” que 2log,y N. Apesar 
de essa recomendação ser vaga, a mensagem 
central foi claramente recebida pela comuni- 
dade em geral. 

A partir desse ponto da história, é possí- 
vel reconhecer uma certa mudança de rota, 
ao menos em algumas áreas da ciência (ou- 


a palestra. 


tras continuaram achando “atratores estra- 
nhos de baixa dimensão” por todo lado). O 
comprimento do registro de dados, a neces- 
sidade de estacionariedade e muitas vezes o 
nível de ruído passaram a ser reconhecidos 
como obstáculos concretos a serem vencidos 
para estabelecer a presença de caos deter- 
minístico, a partir de um conjunto de da- 
dos. Assim, pareceu mais prudente “dar um 
passo atrás” e procurar determinar, a partir 
de dados, se os principais ingredientes para 
haver caos estavam presentes, a saber: não li- 
nearidade, determinismo e estacionariedade. 
Um conjunto de técnicas que rapidamente 
ganhou destaque na comunidade de dinâmica 
não linear foi a chamada análise de dados su- 
brogados, assunto discutido a seguir. 


8.1 Dados Subrogados 


Um dos primeiros artigos dedicados ao proce- 
dimento que veio a ser conhecido como aná- 
lise de dados subrogados, foi publicado por 
James Theiler e colegas, não muito depois 
do artigo de David Ruelle (Theiler et al., 
19924). A ideia central dessa análise, base- 
ada em teste de hipóteses, envolve os seguinte 
passos: 


1. especifica-se uma hipótese nula sobre o 
sistema, como por exemplo, o sistema 
é linear. Essa hipótese é a default, ou 
seja, se não forem encontradas evidên- 
cias fortes o suficiente para rejeitá-la, 
ela permanece aceita; 


2. são gerados dados subrogados (várias 
realizações) que sejam consistentes com 
a hipótese nula definida no primeiro 
item; 


3. define-se uma estatística discriminante, 
que é calculada para a série original 
e para todas as realizações dos dados 
subrogados. Se o valor obtido para a 
série original for significativamente di- 
ferente dos valores encontrados para o 
conjunto de dados subrogados, a hipó- 
tese nula é rejeitada. 


As diferentes hipóteses nulas, as manei- 
ras de gerar os dados subrogados e, por fim, 
a escolha da estatística discriminante são os 
aspectos que normalmente distinguem os vá- 
rios métodos e procedimentos disponíveis na 
literatura. 


Exemplo 8.1.1 


Como primeiro exemplo conceitual, ima- 
ginemos uma série temporal, y(k), que 
pareça aleatória. Desejamos usar o mé- 


todo de dados subrogados para verificar 
se há algo predizível na série. 
Começamos especificando a hipótese 
nula, Ho: a série temporal é aleatória. 
A seguir devemos gerar séries subroga- 
das x;(k), à = 1,..., N, consistentes com 
Ho, ou seja, devemos gerar dados que por 
construção sejam aleatórios. Aqui é im- 
portante que características da série ori- 
ginal, que não influenciem Ho, sejam pre- 
servadas. Por exemplo, as séries subro- 
gadas devem ter o mesmo comprimento, 
a mesma média e variância, se possível a 
mesma distribuição, e assim por diante. 
A seguir é necessário escolher uma es- 
tatística discriminatória, Q), para avaliar 
a hipótese Ho. Para fins de discussão, su- 
ponhamos que Q seja alguma norma do 
erro de predição de algum preditor. Co- 
meçamos calculando essa estatística para 


os dados 


Qo =| y(k) — Flylk — 1)] II, 


em que flulk — 1)| indica o preditor esti- 
mado para prever a série original. À se- 
guir calcula-se a mesma estatística para 
cada uma das séries subrogadas: 


Qs =|| il) fiz] i= 1.00, Ns, 


em que já indica o mesmo tipo de pre- 
ditor ajustado para a i-ésima série su- 
brogada. Por fim, precisamos decidir se 
Qo é estatisticamente diferente dos va- 
lores Qi = 1,...,N,. Se for diferente, 
rejeita-se a hipótese nula de aleatoriedade. 
Caso contrário H, não pode ser rejeitada 
e a série y(k) deve ser considerada alea- 
tória. 


Exemplo 8.1.2 


Este exemplo segue o mesmo raciocínio 
do anterior, mas deseja-se saber se a sé- 
rie tem assinaturas de não linearidade. 
Neste caso Ho: a série temporal é linear. 
Portanto é necessário gerar séries subro- 
gadas que sejam lineares por construção, 
mas que, fora isso, sejam tão parecidas 
quanto possível com a série original. A 
estatística discriminatória deve ser sensí- 
vel a não linearidade. Por exemplo, pode 
ser, como no Exemplo 8.1.1 alguma norma 
do erro de predição de algum preditor li- 
near. 

Suponhamos que a série original seja 
não linear. Nesse caso, espera-se que o 
preditor linear faça predições da série ori- 
ginal com pior desempenho que para as 
séries subrogadas. Assim, neste caso, Qs 


sera maior iqueo o Un ec 
nicamente se diz que Q, é estatistica- 
mente diferente que uv dnne 
a hipótese nula é rejeitada. Rejeitar Ho 
significa que foram encontradas evidên- 
cias de não linearidade suficientemente 
fortes na série original y(k). 

Agora, se y(k) não tiver não lineari- 
dade apreciável, o desempenho do pre- 
ditor linear sobre essa série não será es- 
tatisticamente diferente quando compa- 
rado com o resultado para o conjunto de 
séries subrogadas. Pode ser melhor em 
alguns casos e pior em outros. Em mé- 
dia, não há claras evidências de que Qo 
seja estatisticamente diferente de Qs,,i = 
1,...,N, e H, não pode ser rejeitada. 


Esses exemplos fornecem uma impressão 
da sequência de etapas de que consiste a aná- 
lise de dados subrogados. O método para ge- 


rar as séries subrogadas, tendo escolhido Ho, 
a definição da estatística e a forma de reali- 
zar o teste de hipóteses têm efeito sobre o de- 
sempenho do método. A seguir descrevemos 
algumas das hipóteses nulas mais comuns e 
maneiras de gerar dados subrogados consis- 
tentes com elas. 


8.1.1 Algoritmos para gerar 
dados subrogados 


Os dados são independentes e identicamente 
distribuídos (IID). Uma maneira simples de 
gerar dados subrogados neste caso consiste 
de embaralhar os dados de maneira aleató- 
ria. A distribuição (de amplitudes) dos da- 
dos, portanto, mantém-se inalterada, mas 
qualquer dependência temporal (correlação) 
é destruída. Theiler e colegas atribuem a 
Schienkman e LeBaron (Scheinkman e LeBa- 
ron, 1989) essa maneira de gerar os dados su- 


brogados. No Exemplo 8.1.1 podemos gerar 
os dados subrogados dessa maneira. 

Os dados são explicados por: x = ag + 
Xe + der, em que e; é ruído gaussiano 
com variância unitária. Para gerar dados su- 
brogados para teste dessa hipótese, basta es- 
timar os parâmetros ao, q e o a partir da 
série original. Usando um gerador de nú- 
meros aleatórios com distribuição gaussiana, 
para gerar diferentes realizações de ep, e os 
parâmetros estimados é possível gerar dados 
subrogados. 

Os dados são explicados por: 


q 
LT = 4 + > AnTk-n + 0 Ch, (8.1) 


n=1 


em que ex é definido como anteriormente. 
A expressão (8.1) é um modelo autoregres- 
sivo de ordem q, ou seja, AR(q), a menos 
do parâmetro ag. A geração de dados su- 
brogados compatíveis com a hipótese nula de 


que os dados são explicados por (8.1) é aná- 
loga à explicada no parágrafo anterior. Con- 
tudo, Theiler e colegas descrevem um proce- 
dimento que atribuem a Osborne e colegas 
(Osborne et al., 1986), que em alguns casos é 
numericamente mais robusto e que teve boa 
aceitação pela comunidade. 


O procedimento consiste em tomar a trans- 
formada de Fourier dos dados e embaralhar 
as fases — preservando a simetria conjugada, 
ou seja, a fase na frequência w; é a fase na 
frequência —w;, com o sinal trocado —, de 
maneira a resultar em sinais reais ao tomar 
a transformada inversa, que gera uma série 
subrogada. Como, por construção, o módulo 
da transformada de Fourier não muda, o pe- 
riodograma dos dados subrogados é igual ao 
da série original. Se o nível de ruído não é ele- 
vado, o periodograma é uma boa estimativa 
da função de potência espectral e, portanto, 
os dados subrogados têm a mesma sequência 


de autocorrelação que os dados originais. Em 
outras palavras, tanto a série original como 
os dados subrogados são compatíveis com o 
modelo em (8.1). 


8.1.2 Estatística discriminante 
e teste de hipótese 


O terceiro item do procedimento envolve a 
escolha de uma estatística discriminante que 
deve ser calculada para a série original e para 
os dados subrogados. (Como a intenção do 
trabalho de Theiler e colegas é detectar pos- 
sível dinâmica caótica, a sua escolha de esta- 
tísticas discriminantes reflete esse fato. Eles 
consideraram a dimensão de correlação, o má- 
ximo expoente de Liapunov e erro de predi- 
ção. No caso do erro de predição, Theiler e 
colegas usaram o preditor local linear apre- 
sentado na Seção 9.3.1. Dividiram os da- 
dos em duas metades, sendo a primeira para 


ajustar os parâmetros do modelo e a segunda 
é utilizada para fazer previsões que, no seu 
caso é de um passo à frente. 

Por fim, tendo calculado a estatística de 
discriminatória para a série original e para os 
dados subrogados, é necessário comparar os 
resultados e decidir se as diferenças encontra- 
das são significativas. Para isso, Theiler e co- 
legas descreveram o seguinte procedimento. 
Seja Qo o valor da estatística discriminatória 
calculada para a série original e Q., o valor 
calculado para a i-ésima série subrogada. A 
partir de Os, à? = 1,... Ns, em que Né o 
número de séries subrogadas, determina-se a 
média amostral, (ts e o desvio padrão amos- 
tral às. A medida de significância utilizada 

m (Theiler et al., 1992a) é 


Ido — fis] fis| 
= ;, (8.2) 


A incerteza sobre S para o caso de haver 
apenas uma série original pode ser estimada 


como 


— +82 
As= (8.3) 


A partir de (8.2) e (8.3) pode obter um 
número S + AS que tem a unidade de “sig- 
mas”. Por exemplo, se a distribuição de Qs, 
for gaussiana e S + AS > 2 a hipótese nula 
pode ser rejeitada com 95% de confiança. 
Theiler e colegas consideram S + AS > 3 
como forte evidência para se rejeitar a hipó- 
tese nula. 


Existem outros métodos de dados subro- 
gados (Provenzale et al., 1992) desenvolvidos 
simultaneamente com as técnicas propostas 
por Theiler. 


8.2 Gráficos de 
Recorrência 


A origem dos gráficos de recorrência é cheia 
de interesse e de um certo folclore. Foi con- 
cebido por Jean-Pierre Eckmann e pronta- 
mente desenvolvido e publicado por ele jun- 
tamente com Sylvie Kamphrost? e David Ru- 
elle (Eckmann et al., 1987). O objetivo dos 
gráficos de recorrência era mostrar de ma- 
neira simples a recorrência em sistemas di- 
nâmicos. 

Seja x; € IR”, 1 = 1,...,N uma trajetória 
ou sequência de estados no espaço de esta- 
dos. Se um estado x; se encontra dentro de 


2Sylvie Oliffson Kamphrost à época era aluna de 
doutorado de Eckmann. No ano seguinte à publica- 
ção do artigo sobre gráficos de recorrência, defendeu 
sua tese sobre métodos computacionais aplicados a 
dinâmica não linear e tornou-se professora do Depar- 
tamento de Matemática da Universidade Federal de 
Minas Gerais. 


uma vizinhança de raio e centrada em g,;, di- 
zemos se verificou uma recorrência, ou que 
Z; e x; são recorrentes. Isso é indicado com 
o símbolo 1 — caso contrário com um O — na 
posição i, j de uma matriz R € IRº>” def 
nida como: 


Riileg)=0(—|z;—-z;D,ij=1,...,N, 


(8.4) 
em que e; é o limiar que define o tamanho da 
vizinhança em torno de x;, || - || é alguma 


norma usada para definir distância, como a 
norma euclidiana, e O(:) é a função Heavi- 
side ou função degrau que retorna 1 (0) se 
a distância entre x; e x; for menor (maior) 
que e;. A menos que seja dito o contrário, 
o limiar é constante, ou seja, = Vi. O 
gráfico de recorrência — em inglês RP de re- 
currence plot — é a representação gráfica da 
matriz R, ;, em que normalmente pontos em 
preto representam o símbolo 1, que corres- 
ponde às recorrências, e o símbolo O não é 


indicado. O cálculo de R é realizado com 
base em distâncias de modo que não há supo- 
sição de gaussianidade ou de qualquer outra 
distribuição. Logo os gráficos de recorrên- 
cia não pressupõem que os dados sejam esta- 
cionários. Contudo o gráfico de recorrência 
depende do limiar, pois é ele que define os 
limites dentro dos quais dois pontos são con- 
siderados recorrentes. Por isso, às vezes a 
matriz de recorrências é indicada como R(e), 
para explicitar essa dependência. 

Deve ser notado que, na prática, o estado 
a normalmente é representado no espaço de 
imersão, ou de reconstrução. Assim, para 
que o RP resultante seja útil para a análise 
dos dados, é importante que a imersão seja 
adequada. Por exemplo, se a dimensão do 
espaço de imersão não for suficiente, haverá 
falsos vizinhos, ou seja, falsas recorrências e, 
portanto, a análise por meio do RP é inade- 
quada. 


Exemplo 8.2.1 


Começamos a investigar as principais ca- 
racterísticas de um gráfico de recorrência 
usando um sinal recorrente, isto é, um si- 
nal periódico. Geramos o sinal 


a(t) = senwt, 


em que t = [0 50] com incrementos de 
d+; = 0,05 e frequência w = 27/5, ou seja, 
o sinal tem período T = 5, que corres- 
ponde a T/ô; = 100 valores. Fazendo 
a imersão no espaço de dimensão 2, que 
é a menor dimensão para este caso (por 
quê?, ver Exercício 8.1), e usando 7 = 14 
(ver Exercício 8.2), obtém-se o gráfico de 
recorrência mostrado na Figura 8.1. 
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FIGURA 8.1: Gráfico de recorrência para 
um sinal senoidal. A recorrência “perfeita” 


é indicada por linhas diagonais paralelas 
(QrPsignals). 


Como pode ser observado, o gráfico 
de recorrência é composto de retas para- 
lelas à diagonal secundária, também co- 
nhecida como diagonal identidade. Isso 
indica a perfeita recorrência do sinal. 
Além disso, note-se que a separação — 
seja horizontal, seja vertical — entre as 


retas é de 100 unidades, que corresponde 
ao período do sinal medido em valo- 
res (amostras) do sinal. Como o sinal 
é perfeitamente periódico, qualquer va- 
lor se repete perfeitamente 100 posições 
adiante (ou atrás). Por exemplo, o dé- 
cimo primeiro valor da série coincide com 
o valor nas posições 111, 211, 311 etc. 
Esse fato explica o padrão de retas para- 
lelas para sinais periódicos. 

Outro aspecto que deve ser notado é 
que, como as recorrências são perfeitas, 
mesmo que «0, o gráfico de recorrência 
não muda. 


Exemplo 8.2.2 


Como caso oposto ao investigado no Exem- 
plo 8.2.1, agora consideramos uma sé- 


rie temporal puramente aleatória. Por 
definição, não há recorrências sistemáti- 
cas em un sinal aleatório, independente- 
mente de como seja representado em um 
espaço de “reconstrução”. 

Foram gerados mil valores tomados 
de uma distribuição uniforme com vari- 
ância o? = 0,08 e média uy = 0,5. Na 
Figura 8.2 são mostrados gráficos de re- 
corrência construídos a partir desse sinal. 
No primeiro gráfico foi feita a imersão 
em duas dimensões. Nesse espaço as vi- 
zinhanças são círculos de raio e = 0,1. 
Toda vez que um valor da série cai den- 
tro da vizinhança considerada, coloca-se 
um ponto no gráfico. O que caracteriza 
o gráfico na Figura 8.2a é a falta de re- 
corrências sistemáticas, o que é revelado 
por um conjunto de pontos sem qualquer 
padrão reconhecível. 
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FIGURA 8.2: Gráficos de recorrência para 
um sinal aleatório. Reconstruído com 7 = 1 
(a) de = 2: (b) de = 3 (ORPsignals). e= 
0,1. 


Na Figura 8.2b é usada a mesma sé- 
rie, mas nesse caso a imersão é feita no 
espaço de dimensão três. Consequente- 
mente as vizinhanças nesse espaço são 
definidas como esferas de raio e = 0,1. 
É importante notar que a densidade de 
pontos no espaço de terceira dimensão é 
muito menor que no de segunda. Essa 
é uma das consequências da assim cha- 
mada “maldição da dimensionalidade”. 
Além disso, é menos provável de encon- 
trar recorrências de três pontos consecu- 
tivos do que de dois. Essas são as prin- 
cipais causas de o gráfico de recorrência 
na Figura 8.2b ser menos denso. Mas a 
questão mais relevante é o fato de que 
nem em duas nem em três dimensões há 
qualquer indício de recorrências sistemá- 
ticas no sinal. Ou seja, a conclusão de 
que provavelmente se trata de um sinal 
aleatório é alcançada independente da di- 


mensão de imersão utilizada. 


Exemplo 8.2.3 


Como caso intermediário entre um sinal 
periódico e um sinal aleatório, investiga- 
remos no presente exemplo o caso de um 
sistema caótico. Graças à propriedade 
de transitividade topológica de sistemas 
caóticos, sabe-se que o sistema sempre 
apresenta algum grau de recorrência, o 
que deve ser capturado pelo gráfico de 
recorrência. O que se espera é que recor- 
rências, que em atratores caóticos dissi- 
pativos são “locais” sejam representadas 
em um gráfico de recorrência como dia- 
gonais curtas, paralelas à diagonal secun- 
dária. 

Neste exemplo usamos o sis 


tema (413) que tem por solução 
o atrator corda com (a,b,F,G) = 
(0,258, 4,033,8,0, 1,0) e condições ini- 
ciais Lo — (01,01,01). A Figura 83 
mostra um curto trecho da variável 
x. Desse trecho pode-se perceber um 
elevado grau de recorrência, ou seja, 
o sinal é próximo de ser periódico e 
o pseudo período é de pouco menos 
que 500 amostras do sinal x(t), que foi 
amostrado com ô, = 0,01. 
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FIGURA 8.3: Trecho da variável x do atra- 
tor corda. O pseudo período é pouco menos 
que 500 amostras ((QRPCord). 


Portanto, podemos esperar um grá- 
fico de recorrência com diagonais rela- 
tivamente longas e separadas de pouco 
menos de 500 índices, seja na horizontal, 
seja na vertical, como se pode observar 
na Figura 8.4a (veja Exercício 8.3). 
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FIGURA 8.4: Gráficos de recorrência para 
o atrator corda. Reconstruído com 7 = 15 
e de = 3 a partir da variável (a) x; (b) y 


(QRPCord). 


A Figura 8.4 ilustra um ponto impor- 
tante. O nível de recorrência no gráfico 
da Figura 8.4a, construído usando-se a 
variável x, é maior do que a do outro grá- 
fico, construído usando-se y. Ou seja, a 
variável x reflete melhor a recorrência da 
trajetória do que a variável y. Sabendo 
que se trata do atrator corda, isso não 
causa estranheza, pois a corda — que é 
um objeto de grande recorrência — é pra- 
ticamente invisível ao se observar y ou 2. 
Ou seja, as diferenças entre os gráficos da 
Figura 8.4 podem ser explicadas usando 
os conceitos de observabilidade discuti- 
dos no Capítulo 7. 


Do que temos dito, vemos que uma dia- 
gonal de comprimento | pode ser represen- 
tad Risk jk = 1) de à 
ada como Ri;yk,;+k = 1, q € corresponde à 
recorrência 


Ts Dj... Dig Ss Tjt-l; (8.5) 


em que = indica que os vetores estão dentro 
de uma vizinhança de tamanho e. A relação 
em (8.5) corresponde a dois trechos de traje- 
tória que ficam próximos por um período de 
tempo correspondente ao comprimento 1. 

Uma outra estrutura importante em grá- 
ficos de recorrência são as linhas horizontais 
(ou verticais) de comprimento v. Tais linhas 
podem ser representadas como Ri ;yk =— E a 
e correspondem à situação: 


T;s RR BS Tjtu-l; 


Ts Lj BS Tjtl.. [a Tjtu-l; 


ou seja, o estado varia muito lentamente du- 
rante um tempo correspondente a v. Essa si- 
tuação ocorre em certos comportamentos in- 
termitentes, como próximo a uma bifurcação 
tangente (ver Exemplo 3.3.1). 

Há duas variantes aos gráficos de recor- 
rência, que servem para analisar a relação 
entre mais de uma série temporal. Começa- 


mos definindo o gráfico de recorrências cruza- 
das entre duas séries temporais xy, y, E IR” 
de comprimento N, e N,, respectivamente, 
como (Zbilut et al., 1998): 


CR, ;(ei;) =— O (e — x; — v;||), (8.6) 
i= Ls Nsj=1,.., Ny. 


Nesse tipo de gráfico as séries podem ter 
comprimentos diferentes, mas devem estar 
representadas em um mesmo espaço. Na for- 
mulação acima esse espaço tem dimensão n, 
imaginando que as séries são multidimensio- 
nais, ou seja, são compostas pela observação 
temporal de todas as variáveis de estado dos 
respectivos sistemas de ordem n. No caso de 
não se possuir o registro temporal de todas 
as variáveis de estado, técnicas de imersão de 
séries temporais, com as descritas no Capí- 
tulo 6 podem ser usadas para representar as 
séries em um espaço de imersão de dimensão 
de. A definição em (8.6) permanece inalte- 


rada. Se N, + N, a matriz CR não é qua- 
drada. Assim como o gráfico de recorrência, 
CR não depende de qualquer suposição so- 
bre a distribuição dos dados. 


Portanto, o gráfico de recorrência cruzada, 
em inglês cross recurrence plot, apresenta um 
ponto de recorrência sempre que os sistemas 
de onde foram registradas as séries tempo- 
rais visitarem a mesma vizinhança no espaço. 
Diagonais longas indicam comportamento se- 
melhante entre os sistemas. Assim, CR mos- 
tra a ocorrência simultânea de estados seme- 
lhantes ou, dito de outra forma, indica mo- 
mentos em que há relação linear ou não linear 
entre os sistemas (Marwan e Kurths, 2002). 


A outra variante é o gráfico de recorrência 
conjunta, do inglês joint recurrence plot, é 


definido como (Romano et al., 2004): 


em que x e y não precisam ter a mesma di- 
mensão — mas devem ter o mesmo compri- 
mento —, ou seja, cada série temporal pode 
ser imersa em um espaço de reconstrução 
próprio. 

Da definição em (8.7) é evidente que para 
que JR, ; 4 O é necessário que as recorrên- 
cias em x e em y sejam simultâneas, ou seja, 
JR = RP! NRP”, em que RP! e RP? são 
os gráficos de recorrência individuais de dois 
sistemas. (Como a série temporal de cada 
sistema pode ser imersa em um espaço di- 
ferente, usando unidades diferentes, o dia- 
grama de recorrência conjunta é útil para 
detectar sincronismo de fase entre dois sis- 
temas, como ilustrado a seguir. 


Exemplo 8.2.4 


Neste exemplo, gráficos de recorrência con- 
junta JR;; são usados para detectar o 
acoplamento entre dois osciladores leve- 
mente diferentes: 


ti = y>A 
ww = wxtay+u(yo—y) 
à = b+ta(xi—c) 


(8.8) 
ta = —waya — 29 
yo = woxo + ayo + u(y — ya) 
Zo = b+2z5(x3—C), 


em que (a,b,c) = (0,15, 0,2, 10), seguindo 
(Romano et al., 2004). Os parâmetros 
w1j € wa são usados para produzir desa- 
juste paramétrico. Esses parâmetros são 
responsáveis pela frequência angular com 


que os osciladores giram em torno do res- 
pectivo ponto fixo próximo ao plano x xy. 
Nota-se que em (8.8) os osciladores es- 
tão acoplados de forma dissipativa por 
meio das respectivas variáveis y, sendo 
4 a força de acoplamento. Em termos 
de controle, a ação de controle é do tipo 
proporcional ao erro entre as variáveis y 
com ganho ju. A realimentação é nega- 
tiva. Por fim, como o oscilador 1 influen- 
cia o oscilador 2 e vice-versa, diz-se que 
o acoplamento é bidirecional. 

Quando os osciladores estão desaco- 
plados (u = 0), pequenas diferenças nas 
condições iniciais ou mesmo nos parâme- 
tros resultam em evoluções temporais des- 
correlacionadas. Por outro lado, à me- 
dida que a força do acoplamento ju é au- 
mentada, a evolução temporal dos oscila- 
dores tende a ser mais parecida e dizemos 
que estão sincronizados. 


Nas simulações a seguir, foi usado um 
intervalo de integração de ó, = 0,05, con- 
dição inicial xy = [0,10,10,1] para o pri- 
meiro oscilador e x2 = [0,05 0,05 0,05], 
para o segundo. O tempo de simulação 
foi 200 segundos, sendo que os primei- 
ros 50 foram desprezados na análise, para 
evitar o efeito de transientes. 

A Figura 8.5 mostra o gráfico de re- 
corrência do primeiro oscilador, sendo que 
ambos estão desacoplados (u = 0). Como 
visto anteriormente, a presença de dia- 
gonais interrompidas sugere que o oscila- 
dor se encontra em regime caótico. Como 
não há acoplamento, a evolução temporal 
dos osciladores independe uma da outra. 
Assim, não é surpresa o fato de que o grá- 
fico de recorrência conjunta JR, ; nesse 
caso é composto somente da diagonal se- 
cundária (não mostrado), indicando total 
ausência de quaisquer recorrências que 


ocorram simultaneamente em ambos os 
osciladores. 

A seguir acoplamos os osciladores com 
| = 0,05 e trabalhamos com parâmetros 
levemente diferentes: w = 0,98e wo = 1. 
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FIGURA 8.5: Gráfico de recorrência do os- 
cilador de Róssler desacoplado (ju = 0) com 
w1 = 0,98 (QsimRossCouple). 


Essa diferença entre os valores de pa- 


râmetros e o fraco acoplamento fazem 
com que os osciladores ainda apresentem 
trajetórias temporalmente bastante dife- 
rentes. A Figura 8.6 mostra a diferença 
entre as respectivas variáveis de estado 
dos osciladores. Note como as diferenças 
nessas variáveis têm amplitudes pareci- 
das às próprio atrator. 
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FIGURA 8.6: Diferença temporal entre os 
osciladores de Róssler fracamente acoplados 
(u = 0,05) com w, = 0,98 e w> = 1. As dife- 
renças são da ordem de grandeza do atrator 
(QsimRossCouple). 


A Figura 8.7a mostra o gráfico de re- 
corrência do primeiro oscilador na condi- 
ção de acoplamento fraco. Ao comparar 
e gráfico com o mostrado na Figura 8.5 


é possível notar diferenças nos padrões. 
Isso é esperado uma vez que, como o aco- 
plamento é bidirecional, a dinâmica de 
ambos os osciladores é afetada. A Fi 
gura 8.7a ainda sugere que o primeiro 
oscilador encontra-se em regime caótico. 
Uma maneira quantitativa de comparar 
gráficos de recorrência é apresentada na 
Sec. 8.2.1. 

A Figura 8.7b mostra o gráfico de re- 
corrência conjunta entre os dois oscila- 
dores, em que se percebem algumas Ii- 
nhas diagonais além da diagonal secun- 
dária. A conclusão é que há recorrências 
conjuntas entre os osciladores o que su- 
gere que estão acoplados. Deve ser no- 
tado que esse acoplamento não é eviden- 
ciado de forma clara ao comparar as sé- 
ries temporais dos osciladores (Fig. 8.6). 
Portanto, a utilidade de JR para detec- 
tar acoplamentos fracos, difíceis de per- 


ceber nas séries temporais, está ilustrado. 
Acoplamento fraco, com visto no Capí- 
tulo 10, comumente leva ao sincronismo 
de fase. 

Se o acoplamento for aumentado, via 
de regra, as trajetórias dos osciladores 
ficam mais próximas e o sincronismo é 
mais evidente. Por exemplo, para u = 
0,3, a Figura 8.82 mostra o erro tem- 
poral. Pode-se perceber que, ao contrá- 
rio do observado na Figura 8.6 o erro é 
bem menor que as dimensões do atrator. 
Isso sugere um sincronismo mais forte. A 
intensificação do sincronismo é também 
percebida no gráfico de recorrência con- 
junta (Fig. 8.8b). 
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FIGURA 8.7: (a) RP do primeiro oscila- 
dono =0 08) (biJR = boss 
(QsimRossCouple). 
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FIGURA 8.8: (a) Erro temporal entre osci- 
ladores com u=0,3, w1=0,98 e wo=1; (b) JR 
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(QsimRossCouple). 


Na discussão do exemplo anterior, o fenô- 
meno de sincronismo foi mencionado de forma 
bastante informal. O assunto de sincronis- 
mos de osciladores é vasto e há teoria e vários 
conceitos disponíveis para a formalização do 
tema. O Capítulo 10 apresenta uma introdu- 
ção ao assunto. 


8.2.1 Análise quantitativa 


Um dos aspectos práticos mais atraentes nos 
gráficos de recorrência é que são capazes de 
representar aspectos dinâmicos de maneira 
gráfica. Contudo, em certos estudos, essa 
vantagem é também seu ponto mais fraco. 
Para enfrentar esse desafio surgiu o que veio a 
ser conhecido como RQA (Recurrence Quan- 
tification Analysis), que propõe diversos indi- 
cadores quantitativos que podem ser usados 


para analisar gráficos de recorrência. Uma 
abordagem ainda que superficial dos índices 
que têm aparecido na literatura está fadada a 
ser incompleta. Portanto, alguns poucos ín- 
dices são apresentados para dar ao leitor uma 
ideia dos procedimentos seguidos e mais de- 
talhes podem ser encontrados nas referências 
citadas ao final do capítulo. 

A densidade de pontos de recorrência é 
conhecida como a taxa de recorrência, do 
inglês recurrence rate e é normalmente ex- 
pressa em porcentagem como: 


N 
%REC = a > Rijo) x 100%. (8.9) 


i,j=1 


Portanto, o indicador YREC não reflete as- 
pectos de estrutura do RP, mas simplesmente 
a densidade de pontos de recorrência. 


Um indicador que procura captar aspec- 


tos da estrutura do RP é: 


SS 1P(1) 


WDET = Tete x 100%, (8.10) 


DP) 


em que P(l) é a distribuição de ocorrências, 
ou seja, o histograma, de linhas diagonais de 
comprimento | paralelas à diagonal secundá- 
ria. Assim, YDET quantifica a porcentagem 
de pontos de recorrência que formam linhas 
diagonais de comprimento lin ou maior. lin 
não deve ser grande senão o histograma P(l) 
se torna esparso. Por outro lado lmin deve ser 
suficientemente grande para evitar pequenas 
diagonais espúrias, que não são provocadas 
pela dinâmica (Marwan et al., 2007). Quanto 
maior YDET tão mais recorrente é a série. A 
diferença entre YREC e WDET é que o pri- 
meiro índice leva em conta “recorrências pon- 
tuais”, basta que dois valores no espaço este- 


jam dentro da vizinhança e, que tal recorrên- 
cia é contabilizada. Por outro lado, YDET 
só contabiliza as recorrências que ocorrem e 
se mantêm por, no mínimo, lmin observações 
(amostras temporais). Tais recorrências são 
a ação de uma lei dinâmica determinística, 
o que explica a sigla e o fato de ser comum 
dizer que YDET mede o nível de determi- 
nismo, mas isso, ao pé da letra, está incor- 
reto. Um sistema totalmente determinístico 
pode apresentar valores baixos de YDET. 

A entropia de Shannon da distribuição de 
segmentos foi originalmente definida como: 


ENTR = — 5. p(l) In p(1), (8.11) 


l=Imin 


e se baseia na probabilidade de uma diago- 
nal do RP ter comprimento I, ou seja, p(!) = 
P(1)/N,, em que N, é o número total de li- 
nhas “válidas” (| > lmin). Uma variante de 


(8.11) foi definida como (Letellier, 2006b) 


N 


S=-S3 Pal) In Po(l), (8.12) 


l=1 


em que Pyr(!) é o número de linhas diagonais 

formadas por pontos não recorrentes (R;; = 

0) dividido pelo número de pontos recorren- 

tes. Ao contrário do que ocorre em (8.11), 

em (8.12) Par(l) não é uma probabilidade. 
A divergência 


DIV = (mat) (8.13) 


é definida como sendo a inversa da diagonal 
mais longa. DIV tipicamente está relacio- 
nada ao maior expoente de Liapunov Amax 
(Eckmann et al., 1987; Thiel et al., 2004). 


Exemplo 8.2.5 


Este exemplo usa o sistema de Róssler 
(10.26) com parâmetros (b,c) = (2,4), 
sendo que o parâmetro de bifurcação foi 
variado no intervalo 0,3 < a < 0,55. 
Neste estudo, ver (Portes et al., 2014) 
para detalhes, o parâmetro de bifurcação 
foi variado de forma gradual, segundo os 
seguintes passos: 


É fazer (75,40,20) - (2,00) et 0 
2. incrementar o tempo t < t+ ót; 


3. integrar as equações de Róssler a 
partir da condição inicial até tempo 
t e guardar o ponto (x+,Y, 24); 


4. fazer a + a+3x107",e (x0,%0, 20) — 
(De, Ye, ca 


5. volte ao passo 2 até que a = 0,55. 


Usando a seção de Poincaré (ver Ca- 
pítulo 4): 


P=(ya)eR|v=2&>0), (8.14) 


em que x é a coordenada x do ponto fixo 
que está no centro do atrator, o diagrama 
de bifurcação resultante é mostrado na 
Figura 8.9. Essa figura é utilizada para 
localizar os pontos de transição da di- 
nâmica, que correpondem a alguns pon- 
tos de bifurcação. Deseja-se constatar se 
os índices RQA apresentados são capazes 
de detectar essas mudanças. A mudança 
indicada por SP/SC corresponde à mu- 
dança do atrator caótico espiral, que é o 
mais conhecido dos atratores de Róssler, 
e o atrator caótico funil. P1* indica um 


regime dinâmico de período 1 imerso em 
uma janela caótica. 


P1 P2 Pq P3. Bo" [Elas 


0.30 0.35 “0.40 “045 0.50 0.55 
Bifurcation parameter a 


FIGURA 8.9: Diagrama de bifurcação do 
sistema de Róssler. P1 indica regime perió- 
dico com periodicidade 1, e assim sucessiva- 
mente. SP/SC indica a transição entre caos 
espiral e caos funil no sistema de Róssler. 
Fonte: (Portes et al., 2014). 


As Figuras 8.10 e 8.11 mostram os ín- 
dices ENTR (8.11) e S (8.12) calculados 
a partir de gráficos de recorrência cons- 
truídos com a série temporal de x para 
valores de a. Sem maiores considerações 
é possível constatar que, em geral, S de- 
tecta melhor as transições que ENTR. 


ENTRx 
tas 


bo 


0 


FIGURA 8.10: Índice ENTR (8.11). Cal- 
culado para o sistema de Róssler a partir da 
variável x. Fonte: (Portes et al., 2014). 


Sx 


FIGURA 8.11: Índice S (8.12). Calculado 
para o sistema de Róssler a partir da variável 
x. Fonte: (Portes et al., 2014). 


É importante notar que S é mais con- 
sistente com a noção de complexidade da 
dinâmica que ENTR. Por exemplo, note 
que o valor de S para o regime P2 é su- 
perior que o respectivo valor para o re- 
gime P1, mas é inferior àquele do regime 
P4. Não somente isso, a partir da tran- 


sição SP/SC a tendência geral de S é de 
aumento, indicando aumento da comple- 
xidade da dinâmica, como é esperado de 
um diagrama de bifurcação que mostra 
a rota para o caos por duplicação de pe- 
ríodo. Note que ENTR indica o contrá- 
rio, o que dificulta sua interpretação em 
termos de entropia da dinâmica. Por fim, 
note como durante o regime P3, S clara- 
mente indica uma redução na complexi- 
dade da dinâmica, com esperado, o que 
não ocorre com ENTR. 

Todos os índices RQA apresentados 
nesta seção foram comparados para o caso 
investigado no presente exemplo em (Por- 
tes et al., 2014). 


8.3 Estudo de Caso 


As técnicas e resultados da presente seção po- 
dem ser encontrados com mais detalhes em 
(Carvalho et al., 2018). 


O objetivo é investigar a interação entre 
paciente e ventilador mecânico no contexto 
de ventilação invasiva, ou seja, quando o pa- 
ciente é entubado. O caso não invasivo foi in- 
vestigado em (Rabarimanantsoa et al., 2007; 
Rodrigues, 2011) e nas referências ali citadas. 


Um dos desafios no tratamento intensivo 
de pacientes com patologias respiratórias é 
avaliar a interação paciente ventilador (PVI 
do inglês patient-ventilator interactions). A 
PVI reflete a qualidade da ventilação provida 
e depende de diversos fatores relacionados ao 
paciente e aos ajustes realizados no ventila- 
dor. Como é de se imaginar, as possibilida- 
des são muitas e a subjetividade na análise 
da PVI é grande. 


Um dos objetivos em (Carvalho et al., 
2018) é propor um procedimento de apoio à 
tomada de decisão que seja ao mesmo tempo 
gráfico e quantitativo. As ferramentas uti- 
lizadas são gráficos de recorrência e RQA. 
A seguir são mencionados aspectos básicos 
a fim de ilustrar o potencial de uso dessas 
ferramentas. 


8.3.1 As séries temporais 


Duas séries temporais comumente medidas 
por ventiladores mecânicos e muitas vezes 
mostradas no monitor é um sinal de fluxo de 
ar Q e a pressão na via respiratória P. Esses 
sinais estão disponíveis para processamento 
e foram usados como “trajetórias” no espaço. 

Além disso, foi gerada uma série de valo- 
res dos picos de () em cada ciclo respiratório, 
essa série “discreta” foi chamada Qmax € COr- 
responde aos dados em uma seção de Poin- 


caré. Para ver isso basta pensar em termos 
de uma reconstrução em IR? usando coorde- 
nadas diferenciais em que a seção de Poincaré 
pode ser definida para Q =0e Q <0. 


Uma outra série utilizada, chamada 79, 
é a de duração dos ciclos respiratórios, ou 
seja, TQmas (R) = nal) = Casal e 1) e 
corresponde à série de tempos de retorno à 
seção de Poincaré de onde se tomam os va- 
lores Qmax. Portanto, o estudo foi realizado 
usando-se quatro sinais: Q, P, Qmax € TQma 


Os parâmetros de imersão dessas séries — 
ver Seção 6.4 — foram escolhidos usando a 
função de autocorrelação e um algoritmo de 
falsos vizinhos. Para Q e P a dimensão de 
imersão escolhida foi de = 4, e para Qmax € 
TQmasc de = 3. O limiar para os gráficos de re- 
corrência foi escolhido como e = de x 10% 
da excursão de Q, P e TQna Isso corres- 
ponde aproximadamente a 10% da maior di- 
mensão (diâmetro) dos dados no espaço de 


imersão. O limiar para Qmax foi o mesmo 
que para (). 


8.3.2 Três padrões respiratórios 


À interação paciente ventilador foi analisada 
por uma pneumologista. Três cenários de in- 
teresse foram definidos: 


I. 


II. 


o paciente não apresenta esforço respi- 
ratório. Nesse caso, o ventilador “as- 
sume o comando” impondo o ciclo de 
pressão programado e, portanto, espera- 
se um comportamento regular; 


o paciente apresenta esforço respirató- 
rio e, uma vez detectado, o ventilador 
impõe um nível constante de pressão, 
mas não com frequência constante como 
no cenário I, pois quem determina o iní- 
cio do ciclo é o esforço respiratório do 
paciente; 


HI. o paciente apresenta esforço respirató- 
rio como no cenário II, mas nem sempre 
o ventilador responde impondo pressão. 
Neste cenário são observados esforços 
respiratórios sem o suporte do ventila- 
dor. 


Trechos de sinais e seus respectivos grá- 
ficos de recorrência são mostrados na Fi- 
gura 8.12. 

Em Figura 8.12a-c são mostrados trechos 
de 60 segundos dos sinais de vazão Q (traço 
superior) e de pressão P (traço inferior). Em 
cima dos sinais, a barra preta indica a ja- 
nela em que as principais características dos 
cenários são reconhecíveis. A faixa cinza in- 
dica uma janela estreita em que o comporta- 
mento observado se desvia do padrão domi- 
nante do cenário em questão. Os gráficos de 
recorrência respectivos estão mostrados em 
Figura 8.12d-j. Os gráficos de recorrência 
correspondentes a max € à Toma podem ser 


vistos em Figura 8.12j-o. 


O caráter recorrente dos sinais está clara- 
mente representado nos respectivos gráficos 
de recorrência, especialmente para Q e P. 
Note como trechos correspondentes à faixa 
cinza geram janelas mais claras nos gráficos 
de recorrência. Essa é uma forma simples 
de detectar visualmente não estacionariedade 
nesses sinais. No caso das sequências Qmax € 
TQmas àS recorrências são “amplificadas” pelo 
fato de serem dados tomados em uma seção 
de Poincaré. 


Os gráficos relativos ao cenário I revelam 
grande regularidade nos sinais por meio de 
longas diagonais nos gráficos relativos a Q e 
P e gráficos predominantemente pretos para 
CQmax € TQma: O gráfico para esta última 
sequência é sensível ao desvio do padrão do 
cenário I, indicada pela faixa branca. 


No caso do cenário II, ainda é possível 
detectar um alto nível de recorrência, porém 


as diagonais são mais curtas que para o caso 
do cenário 1, uma vez que há uma certa ir- 
regularidade no padrão respiratório. Tal va- 
riabilidade é bem detectada pelo gráfico de 
recorrência de 79,1, que é majoritariamente 
branco. 


A redução no nível de recorrência, que 
corresponde ao aumento de variabilidade, nos 
sinais do cenário II é perceptível nos gráficos 
de recorrência de Q e P e, principalmente, de 
(max, sendo que no gráfico de Tq,.. às partes 
em branco dominam. 


Scenario | Scenario Il Scenario III 
(o), 


A RR Ad 
Luau IT] 


(f) 


(a), 
DNIT 


Error 


FIGURA 8.12: Sinais e gráficos de recorrência 
para os três cenários. Ver descrição no texto. 
Fonte: (Carvalho et al., 2018). 


Assim, neste problema, os gráficos de re- 
corrência de Qmax € de TQnaz São particu- 
larmente úteis para distinguir os três cená- 
rios. Um esquema para isso é ilustrado na 
Figura 8.13. Se os dois gráficos de recorrência 
forem majoritariamente pretos, dizemos que 
se trata do cenário I. Se o gráfico de Qmax for 
preto e o de 79, branco, assumimos que é 
o cenário II. Por fim, se o gráfico de Qmax for 
“cinza” — e esta decisão é um tanto quanto 
subjetiva —- e o de T9,,.« Continua majoritari- 
amente branco, dizemos que é o cenário III. 


8.3.3 Classificação visual 


Aqui usaremos o esquema de classificação 
ilustrado na Figura 8.13 para análise de uma 
longa série temporal de vazão Q, mostrada 
na Figura 8.14a. Nesse gráfico há três janelas 
de 1h de duração indicadas em preto. Essas 
janelas foram selecionadas por uma pneumo- 


logista por representarem características pre- 
dominantes dos cenários 1 a III. 


Scenarios 
HH 


| II 
-EEZ 
0/4 


FIGURA 8.13: Esquema para classificação dos 


cenários. Ver descrição no texto. Fonte: (Car- 
valho et al., 2018). 


A partir dessas janelas foram caleu- 
ladas as sequências Qmax € TQma bem 
como seus respectivos gráficos de recorrência. 
Os padrões “preto/preto”, “preto /branco” e 
“cinza/branco” definidos na Figura 8.13 são 
distinguíveis. Testes cegos, com dados de 
seis pacientes indicou uma taxa de acerto 


de 95% na classificação dos padrões respi- 
ratórios baseada no esquema da Figura 8.13 
quando comparado com a classificação feita 
pela pneumologista, que analisou os sinais Q 
e P. 


8.3.4 Classificação baseada 
em RQA 


Uma vez que se tem os gráficos de recorrên- 
cia, é possível analisá-los quantitativamente, 
como visto na Sec. 8.2.1. Aqui usamos a taxa 
de recorrência sem ser percentual — compare 
com (8.9): 


N 
1 
RR= a > Rito), (8.15) 


ij=1 


e a entropia S conforme definida em (8.12). 
Cada um desses indicadores é calculado a 
partir dos gráficos de recorrência das sequên- 


cias Qmax € TQmas: Os resultados são mostra- 
dos na Figura 8.15. 
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FIGURA 8.14: Sinal e gráficos de recorrência 
para classificação. Descrição no texto. Fonte: 
(Carvalho et al., 2018). 


A partir dos resultados mostrados na Fi- 
gura 8.15, é possível constatar que os grupos 


são separáveis nos planos RR, x RRq,a € 
57 X Qua portanto é possível classificar os 
cenários de forma não ambígua utilizando a 
taxa de recorrência e a entropia calculados a 
partir dos gráficos de recorrência de Qmax € 
de TO 
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FIGURA 8.15: (a) RR; X RRQuaz (D) XI OQ max 
Círculos em verde: cenário I; triângulos azuis: 
cenário II, e quadrados vermelhos: cenário III. 
Fonte: (Carvalho et al., 2018). 


Leitura Recomendada 


A ideia por trás da análise de dados subro- 
gados é mais antiga no campo da estatística 
onde técnicas parecidas são conhecidas sob 
o nome de bootstrapping. Um trabalho pi- 
oneiro e de grande impacto que aplicou es- 
sas técnicas na área de sistemas dinâmicos 
é (Theiler et al., 1992a). O tema de aná- 
lise de séries temporais usando esse conjunto 
de técnicas é tratado em detalhes por Small 
(Small, 2005). Uma aplicação da análise 
de séries temporais usando dados subroga- 
dos pode ser encontrada em (Gomes, 2001) 
para dados de variabilidade de frequência 
cardíaca, e em(Coelho, 2006; Coelho et al., 
2008), para séries pseudo-periódicas. 


O trabalho pioneiro na área de gráficos 
de recorrência é (Eckmann et al., 1987). Os 
gráficos de recorrência cruzada parecem ter 
sido propostos em (Zbilut et al., 1998), onde 


as séries temporais envolvidas deveriam ter 
o mesmo comprimento. Essa ideia foi re- 
tomada pouco depois com novas formas de 
quantificar características dos gráficos de re- 
corrência cruzada (Marwan e Kurths, 2002) e 
aplicada em dados experimentais pouco de- 
pois (Shockley et al., 2002; Marwan et al., 
2002). Na última referência citada, os auto- 
res mostram como é possível determinar uma 
mudança de escala do tempo de um sistema 
para que passe a estar sincronizado com o 
outro. 


Os gráficos de recorrência conjunta foram 
propostos em (Romano et al., 2004). A apli- 
cação proposta foi a investigação de cenários 
de sincronismo em dois osciladores acopla- 
dos. Além disso, os autores mostraram que 
é possível calcular a entropia de Rényi con- 
junta de segunda ordem a partir da matriz 
de recorrência conjunta JR, ;. 


Uma referência online sobre gráficos de 


recorrência é: 
http://www.recurrence-plot.tk/glance.php. 
Não somente informação básica sobre esses 
gráficos como também RQA (Recurrence 
Quantification Analysis) e software podem 
ser encontrados. Em particular, podem ser 
achados pacotes em Python, R, Julia e Ma- 
tlab. Os gráficos de recorrência mostrados 
na Seção 8.2 foram produzidos com o pacote 
de autoria de Yang e Chen (Yang, 2011; 
Chen e Yang, 2012). 


Uma introdução ao assunto de análise 
quantitativa de recorrência pode ser en- 
contrada em (Zbilut e Webber Jr, 2007). 
Leonardo Portes foi um dos primeiros a 
preocupar-se como a escolha da variável re- 
gistrada afeta o desempenho da RQA (Portes 
et al., 2014). Chistophe Letellier argumen- 
tou que para que a entropia quantificasse a 
complexidade do regime dinâmico, é neces- 
sário usar S em (8.12) ao invés de ENTR 


em (8.11) (Letellier, 2006b). O contra- 
argumento dos defensores de ENTR é que 
essa entropia quantifica a complexidade do 
RP, não necessariamente da dinâmica. Há 
um pequeno erro no algoritmo em (Letellier, 
2006b), que o próprio autor detectou e corri- 
giu em http://www.atomosyd.net/spip.php?article74. 

Um outro aspecto importante levantado 
por Christophe Letellier em (Letellier, 2006b) 
é que ao utilizar dados sobre uma seção de 
Poincaré, ao invés de utilizar diretamente a 
trajetória completa no espaço, a informação 
quantificada usando técnicas de RQA é mais 
facilmente perceptível. Essa observação foi 
confirmada em trabalhos posteriores (Raba- 
rimanantsoa et al., 2007; Portes et al., 2014). 


Exercícios 


8.1. Repita o Exemplo 8.2.1, mas faça a 
imersão com de = 1e7 = 14. Discuta as 


diferenças observadas no gráfico de recorrên- 
cia. 


8.2. Repita o Exemplo 8.2.1, faça a imersão 
com de = 2, mas varie o valor do tempo de 
atraso T. Discuta as diferenças observadas 
no gráfico de recorrência. 


8.3. Procure explicar as diferenças entre 
Figura 8.4a e Figura 8.4b. Dica: observe 
as principais características das séries tem- 
porais. 


8.4. Gere o gráfico de recorrência para o 
atrator de Róssler com (a, b,c) = (0,398, 2,4) 
a partir da variável z com 7 = 50e de = 3. 
Interprete e discuta o resultado. 


Capítulo 9 


Modelagem a 
Partir de Dados 


Os últimos trinta anos testemunharam um 
significativo desenvolvimento das técnicas de 
modelagem aplicadas a sistemas dinâmicos 
não lineares. Este capítulo procura fazer uma 
apresentação histórica do assunto. Portanto 
a ênfase é mostrar como as técnicas dispo- 


níveis surgiram no âmbito da dinâmica não 
linear. O leitor interessado em implementar 
tais métodos deve procurar os detalhes nas 
referências indicadas. Diversos aspectos do 
problema de modelagem de sistemas não li- 
neares, que independem do tipo de represen- 
tação matemática usada,! são também dis- 
cutidos de forma qualitativa. 

Antes de rever um pouco da história da 
modelagem de sistemas e sinais com diná- 
mica caótica, é importante ressaltar que, di- 
reta ou indiretamente, os trabalhos têm por 
base as técnicas de imersão discutidas no Ca- 
pítulo 6. Este capítulo é baseado em (Aguirre 
e Letellier, 2009). 

Um aspecto deste capítulo é que a maio- 


IPor representação matemática entende-se a 
classe de modelos, por exemplo: NARMAX (do in- 
glês Nonlinear AutoRegressive Moving Average mo- 
dels with eXogenous inputs) polinomiais, NARX (do 
inglês Nonlinear AutoRegressive models with eXoge- 
nous inputs) neurais, modelos fuzzy, dentre outros. 


ria das referências citadas são das décadas de 
1990 e 2000. Uma razão para isso é registrar 
que grande avanço na área de modelagem 
de dinâmica caótica deu-se nessas décadas. 
Como é comum ocorrer na ciência, após al- 
guns anos de baixa atividade em uma deter- 
minada área, surgem novos trabalhos “rein- 
ventando a roda”, cujos autores desconhe- 
cem o corpo de literatura disponível. Aqui 
procura-se ajudar a sanar esse problema. 


9.1 Perspectiva Histórica 


Tentar descobrir as origens de certos desen- 
volvimentos científicos é um grande desafio, e 
tal tarefa reserva seus perigos. Para a mente 
curiosa, é sempre um encanto descobrir como 
foi que certos assuntos evoluíram com o pas- 
sar dos anos e verificar o quanto a mais se co- 
nhece sobre um tema hoje em relação à época 
de sua descoberta. Por outro lado, existe o 


inevitável perigo de interpretar a História de 
forma indevida, bem como a impossibilidade 
de esgotar todas as fontes de informação per- 
tinentes ao assunto investigado. Como se não 
bastassem tais dificuldades, deve-se conviver 
com o fato de que o ponto de vista de um 
verdadeiro historiador necessariamente muda 
com o passar do tempo. Mesmo com tantos 
desafios e dificuldades, neste capítulo deseja- 
se apresentar ao leitor um ponto de vista 
de como as técnicas de modelagem aplicadas 
a sistemas dinâmicos não lineares se desen- 
volveram nas últimas três décadas, mas não 
somente isso, alguns conceitos fundamentais 
são abordados. O objetivo é manter a discus- 
são em nível conceitual, sem necessariamente 
atrelá-la a alguma representação específica. 
Ao mencionar casos particulares, o objetivo 
é meramente ilustrativo. 


9.1.1 Trabalhos Pioneiros 


A origem dos trabalhos de modelagem, den- 
tro do contexto de sistemas dinâmicos não 
lineares, remonta aos trabalhos de Packard 
e colegas, Takens, Broomhead e King (Pac- 
kard et al., 1980; Takens, 1981; Broomhead 
e King, 1986). Os dois primeiros trabalhos, 
como visto no Capítulo 6, tratam da imersão 
de séries temporais. Por outro lado, o tra- 
balho de Broomhead e King trata do uso de 
técnicas de decomposição em valores singu- 
lares na reconstrução de atratores, mas nesse 
trabalho os autores não se ocuparam na cons- 
trução de modelos paramétricos globais. Ao 
longo deste capítulo, usamos o jargão “cons- 
trução de modelos” (do inglês model building) 
para indicar o processo de escolha da estru- 
tura e estimação de parâmetros. Em enge- 
nharia esse procedimento é conhecido como 
identificação de sistemas (Aguirre, 2015). 
Edward Lorenz, sendo metereologista, 


preocupava-se com o problema de predição 
de condições climáticas. Um dos conceitos 
que atribuídos a ele é o da predição usando sí- 
miles. A ideia é bastante intuitiva. Suponha 
que se deseje prever o tempo de amanhã, di- 
gamos, temperatura média ao longo do dia e 
a humidade relativa. O procedimento imagi- 
nado por Lorenz consistia de buscar em uma 
grande base de dados o dia com as carac- 
terísticas mais próximas às de hoje. Como 
predição para amanhã pode-se usar a tem- 
peratura média e a humidade relativa do dia 
seguinte ao dia com característica próximas 
às de hoje. 

Um dos marcos na tentativa de prever sé- 
ries temporais caóticas foi a proposição do 
preditor local linear? em 1987 por Farmer e 
Sidorowich. O procedimento segue a ideia 
central do método de símiles de Lorenz. Ao 
invés de usar como predição o valor seguinte 


2Local linear predictor, em inglês. 


de uma ocorrência próxima à atual, fazia-se 
uma regressão com um conjunto de valores 
vizinhos, como descrito a seguir. Em poucas 
palavras, o procedimento consiste em fazer a 
imersão da série temporal, dividir o espaço de 
imersão em vizinhanças e ajustar funções lo- 
calmente “lineares” — a bem da verdade, eles 
usaram funções localmente afins — que des- 
crevam como os pontos em uma vizinhança 
são mapeados para a próxima. Um aspecto 
interessante desse procedimento é que, após 
a imersão, o problema de predição de diná- 
mica torna-se um problema de ajuste geomé- 
trico de curvas (ver exercício 9.1). O predi- 
tor local linear, que não pode ser expresso 
em forma fechada, é descrito brevemente na 
Seção 9.3.1. 


Na comunidade de dinâmica não linear 
possivelmente o primeiro trabalho a tratar o 
problema de construir um modelo global, em 
forma fechada, a partir de um conjunto de 


dados foi (Crutchfield e McNamara, 1987). 
Nesse trabalho os autores discutiram o pro- 
blema de forma mais geral, em vez de de- 
senvolverem uma representação matemática 
para quantificar dinâmica não linear a par- 
tir de dados. Assim sendo, os autores não se 
detiveram em problemas que posteriormente 
passaram a ser reconhecidos como sendo im- 
portantes tais como a escolha da estrutura 
e a validação de modelos. É digno de nota, 
entretanto, que Crutchfield e McNamara não 
tenham citado trabalhos de identificação de 
sistemas não lineares, que em 1987 já eram 
conhecidos na literatura de Engenharia. Esse 
é mais um exemplo em que áreas diferentes 
desenvolvem, muitas vezes de forma indepen- 
dente, técnicas para tratar de problemas pa- 
recidos. 


Em 1987, Cremers e Hubler publicaram 
um trabalho que, de certa maneira, pode ser 
visto como o primeiro de uma série. Os auto- 


res abordaram o problema de construir equa- 
ções diferenciais não lineares a partir de da- 
dos. O campo vetorial é aproximado por ex- 
pansões de polinômios de Legendre e assume- 
se que todas as variáveis de estado são medi- 
das. Os exemplos usados incluem o oscilador 
de van der Pol e o sistema de Lorenz (Cre- 
mers e Hiibler, 1987). 

Um artigo que, de certa forma pode ser 
considerado de transição, foi o publicado por 
Broomhead e Lowe em 1988. O trabalho 
trata de aproximar funções estáticas, tais como 
o OU-exclusivo, por meio de redes de funções 
radiais de base (Broomhead e Lowe, 1988). 
Os autores, que já haviam tomado conhe- 
cimento dos artigos, (Farmer e Sidorowich, 
1987; Casdagli, 1989)º encerram o artigo com 
uma aplicação de previsão de duas séries tem- 
porais caóticas geradas pela equação logística 


“Broomhead e Lowe citam a versão de (Casdagli, 
1989) que foi submetida em janeiro de 1988. 


e pelo mapa 7,1 = 2x, (modulo 1). 


O trabalho de Casdagli, publicado em 1989, 
foi possivelmente o primeiro trabalho na área 
de sistemas dinâmicos não lineares a abor- 
dar o problema inverso de reconstrução de 
modelos globais a partir de dados caóticos 
com o fim de reproduzir certas característi- 
cas do sistema original, tais como seções de 
Poincaré e diagramas de bifurcação (Casda- 
gli, 1989). À semelhança de Broomhead e 
Lowe, Casdagli também usou como represen- 
tação redes de funções radiais de base (RBF), 
mas a ênfase do trabalho não é o procedi- 
mento de construção de tais modelos e sim as 
características estatísticas das predições ob- 
tidas. De fato, Casdagli foi um dos primeiros 
a sugerir que previsibilidade em curto prazo 
— utilizando algum modelo não linear — é 
uma maneira prática de distinguir caos de 
ruído. Por outro lado, em periódicos de En- 
genharia, o problema da construção de redes 


RBF já era abordado de forma sistemática, 
mas sem preocupação de reconstrução de in- 
variantes dinâmicos como os referidos acima 


(Chen et al., 1990). 


9.1.2 Os primeiros desafios 


De certa maneira, pode-se entender que os 
trabalhos mencionados até este ponto lan- 
çaram os alicerces da construção de mode- 
los para sistemas caóticos. A década de 90 
testemunhou a aplicação de diversas repre- 
sentações (classes) de modelos matemáticos 
na busca de soluções práticas para esse pro- 
blema. 

No início da década de 90, foram publi- 
cados diversos artigos que se propunham a 
construir equações diferenciais não lineares a 
partir de dados. Nesse propósito, tais artigos 
assemelham-se ao trabalho de Cremers e Hu- 
bler. Giona e colegas propuseram um proce- 


dimento para aproximar tanto mapas quanto 
fluxos utilizando expansões polinomiais ge- 
neralizadas (Giona et al., 1991). O procedi- 
mento é bastante complicado e nos exemplos 
citados (mapas de Hénon e Ikeda; e o sistema 
de Lorenz) foram utilizadas séries de dados 
muito longas e sem ruído. Parece, assim, que 
a imprtância dos trabalhos de Cremers, Gi- 
ona e os respectivos colaboradores é mais his- 
tórica do que prática. 


Objetivando ainda a construção de um 
conjunto de equações diferencias — à seme- 
lhança dos trabalhos de Cremers e Giona —, 
Gouesbet, Maquet, Letellier e LeSceller, pes- 
quisadores franceses da Université de Rouen, 
desenvolveram um procedimento muito mais 
simples do que aqueles de que se dispunha até 
então (Gouesbet, 1991; Gouesbet e Maquet, 
1992; Gouesbet e Letellier, 1994; Le Sceller 
et al., 1996; Le Sceller et al., 1999). Tais 
pesquisadores foram além de simplesmente 


propor um algoritmo de ajuste de equações 
diferencias a dados (simulados e reais), pois 
procuraram entender as limitações de tentar 
aproximar campos vetoriais racionais usando 
modelos polinomiais. 


Outros trabalhos publicados na primeira 
metade da década de 90 também considera- 
ram equações diferenciais (normalmente po- 
linomiais) como representação matemática. 
Dentre esses destaca-se o trabalho de de Ba- 
ake e colegas cujo principal foco era o de 
estimar os parâmetros de equações diferen- 
cias com estrutura conhecida. Se, por um 
lado, o grupo da Université de Rouen usava 
o estimador de mínimos quadrados para es- 
timar parâmetros, um algoritmo conhecido 
como multiple shooting foi utilizado em (Ba- 
ake et al., 1992). Esse algoritmo, estudado 
na tese de doutorado de Hans Georg Bock da 
Universidade de Heidelberg, seria utilizado 
por vários outros autores nos anos seguin- 


tes. Um outro trabalho mencionado é o de 
Brown e colegas. Eles também aproximam o 
campo vetorial com equações diferenciais po- 
linomiais. A principal diferença para os tra- 
balhos anteriores é que, aceitando o fato real 
de que os dados disponíveis foram amostra- 
dos, o método utilizado para estimar os pa- 
râmetros leva em conta o caráter discreto dos 
dados. Isso foi feito considerando-se a apro- 
ximação de Adams? para a derivada (Brown 
et al., 1994b). Com isso, a estimativa de de- 
rivadas fica implícita no método, o que não 
ocorre em outros métodos em que as deriva- 
das são explicitamente calculadas (Gouesbet 
e Letellier, 1994). 


A primeira metade da década de 90 tam- 
bém testemunhou a aplicação pioneira de ou- 


4Por exemplo, seja f o campo vetorial e dt O 
intervalo de discretização, o esquema de Adams 
de segunda ordem determina que x; = %X-1+ 
0,56t[f (ate) + f(agy-tr-1)] (Parker e Chua, 1989). 


tras representações matemáticas ao problema 
da modelagem de dinâmica não linear. Redes 
neurais artificiais do tipo perceptron multica- 
madas (MLP).º Dentre os primeiros traba- 
lhos nessa área encontram-se (Albano et al., 
1992; Principe et al., 1992), sendo que resul- 
tados bastantes sofisticados foram apresen- 
tados em (Bakker et al., 2000). O uso de 
redes neurais do tipo Elman (com recorrên- 
cia interna) foi investigado em (Gençay e Liu, 
1997). Em vários desses trabalhos a valida- 
ção, frequentemente, foi feita usando-se índi- 
ces tais como a dimensão fractal e o maior 
expoente de Lyapunov. A questão de como 
avaliar a qualidade de modelos dinâmicos é 
tratada na Sec. 9.5. 


“Do inglês multilayer perceptron. 


Desafios mais recentes 


A área de modelagem não linear de siste- 
mas dinâmicos amadureceu. Naturalmente, 
novos desafios e problemas passaram a ser 
abordados. Muitos desses problemas são des- 
critos no restante deste capítulo. Nesta se- 
ção, entretanto, deseja-se indicar alguns tra- 
balhos especificamente voltados ao problema 
de construção de modelos. 

No âmbito de modelos contínuos, Clau- 
dia Lainscsek e colaboradores desenvolveram 
uma biblioteca de funções (polinomiais) de 
base para aproximar campos vetoriais não li- 
neares (Lainscsek et al., 2001). O uso de tais 
funções de base permite realizar, em alguma 
medida, a escolha de estrutura do modelo, 
assunto tratado em maior detalhe na Sec. 9.4. 

Os efeitos da escolha da variável para re- 
construir a dinâmica demorou a ser reconhe- 
cida no contexto de modelagem, mas atual- 
mente esse aspecto é comumente mencionado 


(Parlitz et al., 2014; Mangiarotti et al., 2016; 
Mangiarotti et al., 2018; Krakovská e Jaku- 
bik, 2020). 


O uso do conceito de RC (do inglês reser- 
voir computing) com modelos do tipo ESN 
(do inglês echo state networks) vem sendo 
usado com grande sucesso na modelagem de 
dinâmica caótica (Pathak et al., 2017; Lu 
et al., 2018; Darmon et al., 2019; Ushikoshi, 
2022). Um aspecto interessante dessa repre- 
sentação é que o reservatório inclui “realimen- 
tação”, portanto, os modelos tipo ESN são 
redes recorrentes. As implicações da recor- 
rência em modelos para representar sistemas 
dinâmicos foram discutidas com detalhes por 
Antônio Ribeiro (Ribeiro, 2020). 


9.2 Obtenção de Dados 


9.2.1 A escolha da variável 
de saída 


Após o conhecido artigo de Floris Takens, 
é comumente aceito que é possível utilizar, 
pelo menos em princípio, um conjunto de co- 
ordenadas de atraso para mapear um con- 
junto finito de valores atrasados de uma va- 
riável para um espaço de dimensão de no 
qual o objeto resultante é topologicamente 
equivalente àquele produzido pelo sistema di- 
nâmico no espaço de estado original, de di- 
mensão mn (Takens, 1981). Para que isso seja 
possível, basta garantir que de. seja suficiente- 
mente grande em relação à dimensão do ob- 
jeto (D < n) sendo reconstruído. Esse pro- 
blema, conhecido como imersão — ver Capí- 
tulo 6, tem sido tratado em diversos textos 
(Sauer et al., 1991; Abarbanel et al., 1993; 


Schreiber, 1999). O uso de coordenadas de 
atraso no contexto da identificação de siste- 
mas e estatísitca, entretanto, é muito ante- 
rior ao trabalho de Takens (Eykhoff, 1968; 
Aguirre, 2015). 


Em problemas práticos de modelagem a 
partir de dados, entretanto, devido a diver- 
sos fatores limitantes, tais como ruído e re- 
gistros finitos de dados, a escolha de qual 
variável deve ser utilizada para se construir 
um modelo é fundamental. Ainda que, te- 
oricamente, um difeomorfismo exista, o uso 
de certas variáveis para se observar um sis- 
tema pode dificultar ou totalmente frustrar a 
construção de um modelo a partir dos dados 
disponíveis. Diversos problemas relacionados 
a isso e vários exemplos foram discutidos no 
Capítulo 7. 


9.2.2 Escolha do tempo 
de amostragem 


O teorema da amostragem recomenda que se 
um determinado sinal contínuo no tempo for 
amostrado a uma taxa maior que duas vezes 
a maior frequência de interesse não haverá 
superposição de espectros (aliasing). Isso sig- 
nifica que existe uma relação unívoca entre a 
sequência discreta de amostras e o sinal em 
tempo contínuo e que, ao menos em teoria, 
é possível reconstruir o sinal original a partir 
dos dados amostrados. Na prática é comum 
amostrar um sinal a uma taxa 5 a 10 vezes 
maior do que a maior frequência de interesse. 


No contexto da imersão de sinais usando- 
se um conjunto de coordenadas de atraso, um 
problema relacionado é a escolha do tempo 
de atraso, como discutido no Capítulo 6. Di- 
versos critérios para auxiliar nessa escolha 
podem ser encontrados na literatura (Abar- 


banel et al., 1993; Schreiber, 1999). Seme- 
lhantemente, é necessário amostrar um sinal 
contínuo quando o objetivo é construir um 
modelo discreto a partir de dados. Apesar 
desse problema ser parecido ao da escolha do 
tempo de atraso para um conjunto de coor- 
denadas, em geral são necessários valores me- 
nores para o tempo de amostragem quando o 
objetivo é identificar um modelo NARMAX 
polinomial (Aguirre, 1995b). Na construção 
de modelos contínuos, por sua vez, os valo- 
res para o tempo de amostragem são muito 
menores ainda por causa da necessidade de 
estimar numericamente as derivadas do si- 
nal. 


A quantidade de dados necessária para 
identificar modelos NARMAX polinomiais é 
tipicamente bem menor que a usada para 
construir outros tipos de modelos. Em mui- 
tos casos poucas centenas de dados são sufi- 
cientes para se obter modelos com boas pro- 


priedades estatísticas. É também mais difícil 
avaliar se tais modelos também têm boas pro- 
priedades dinâmicas, pois isso depende de di- 
versos outros fatores, como discutido no res- 
tante do capítulo. 


9.2.3 Ruído e estacionariedade 


A maioria das técnicas de identificação pres- 
supõe que o processo à ser modelado é esta- 
cionário. À razão para isso é que, de forma 
geral, os modelos determinísticos descrevem 
a relação dinâmica que existe entre o con- 
junto de variáveis independentes (frequente- 
mente chamadas de regressores) e a variá- 
vel dependente (normalmente denominada a 
saída ou série temporal). Assume-se que essa 
relação dinâmica não muda ao longo da ja- 
nela de dados utilizada na construção do mo- 
delo. Além disso, características tais como 
estacionariedade e ergodicidade referem-se ao 


processo subjacente aos dados e não à janela 
de dados usada, que nada mais é do que uma 
realização de tal processo. 


Considere uma série temporal com 1000 
valores que pode ser dividida em 10 janelas 
sem superposição, portanto cada janela tem 
100 valores. Se a dinâmica subjacente for 
a mesma ao longo te toda a série original, 
qualquer uma das 10 sub-janelas poderia, em 
princípio, ser usada para se construir um mo- 
delo para o processo. Assim, se cada uma 
das 10 janelas for usada para se obter um 
modelo, cada um dos 10 modelos resultantes 
pode ser interpretado como uma realização 
de um mesmo modelo geral. Aumentando-se 
o tamanho da janela de dados, normalmente 
as propriedades estatísticas do modelo me- 
lhoram também. Entretanto, o que acontece 
se a dinâmica subjacente mudar de uma ja- 
nela para a próxima? Nesse caso, não se- 
ria surpreendente se fossem encontrados 10 


modelos com características distintas, e não 
mais 10 diferentes realizações de um mesmo 
modelo geral. Assumindo que não se saiba 
a priori que a dinâmica subjacente varia, ou 
seja, não se sabe que a série temporal é não 
estacionária, o que aconteceria se os 1000 va- 
lores da série original fossem usados na cons- 
trução de um único modelo? Provavelmente 
o modelo resultante apresentaria um desem- 
penho pobre uma vez que poderia ser inter- 
pretado como um modelo resultante da mé- 
dia de dez modelos distintos. Nesse caso há 
pelo menos três alternativas possíveis para 
aliviar o problema da não estacionariedade. 


A primeira alternativa, que é a mais ób- 
via e também a comumente adotada, con- 
siste em subdividir a janela de dados em 
sub-janelas que sejam suficientemente curtas 
de forma que se possa assumir a estaciona- 
riedade (durante uma dessas sub-janelas) de 
maneira realista. Essa alternativa traz pro- 


blemas para técnicas de modelagem que re- 
querem janelas de dados mais longas. Além 
disso, esse procedimento não é eficaz no 
caso de sistemas fortemente não estacioná- 
rios. Contudo isso, tal alternativa pode 
ser usada com sucesso na prática (Glass e 
Kaplan, 1994) e em particular no contexto 
de modelos NARMAX polinomiais, que po- 
dem ser construídos com relativamente pou- 
cos pontos (Barahona e Poon, 1996; Aguirre 
et al., 1999; Gomes et al., 2000). 


A segunda possibilidade é assumir que a 
variação da dinâmica subjacente ocorre de 
acordo com um parâmetro variante no tempo 
que está disponível (Le Sceller et al., 1996; 
Cao et al., 1997). Isso, evidentemente, equi- 
vale a considerar tal parâmetro como uma 
entrada ou variável exógena em um modelo 
NARMAX, o que é um procedimento muito 
bem conhecido em identificação de sistemas. 
A grande dificuldade é que nem sempre o pa- 


râmetro variante no tempo é registrado. 

Isso conduz à terceira alternativa que 
consiste em explicitamente incluir o tempo 
como uma variável dentro do modelo, seja 
considerando o tempo como uma variável in- 
dependente (Cao et al., 1997), seja descre- 
vendo os parâmetros do modelo como as saí- 
das de um sistema dinâmico determinístico 
(Arnold et al., 1998). 

Alguns efeitos de não estacionariedade nos 
dados sobre modelos identificados são discu- 
tidos em (Aguirre e Letellier, 2012). 


9.2.4 Sistemas não autônomos 


É fácil constatar na literatura de sistemas di- 
nâmicos que há muito mais resultados para 
sistemas autônomos do que para não autô- 
nomos. O contrário é verdadeiro na litera- 
tura de identificação de sistemas. Algumas 
discussões preliminares na área de imersão 


podem ser encontradas em (Casdagli, 1992; 
Hunter, 1992). Uma observação importante 
é que o procedimento padrão de se reescrever 
um sistema não autônomo como um sistema 
autônomo estendido, para efeito de análise, 
só pode ocorrer nos casos em que a função 
forçante (entrada) pode ser expressa em forma 
fechada (Ménard et al., 2000), o que é uma 
raridade em situações práticas de interesse. 


Nos casos em que a entrada pode ser qual- 
quer função temporal, é praticamente im- 
possível incluí-la como parte de um sistema 
autônomo. Entretanto, em tais casos, é mais 
conveniente considerar tal sinal como sendo 
exógeno ao modelo e passar a modelar a re- 
lação de entrada-saída do sistema. A grande 
vantagem desse procedimento é que permite 
lidar com uma grande classe de problemas 
em que os sinais de saída são séries temporais 
não estacionárias (Aguirre e Letellier, 2012). 
Para perceber isso de forma mais clara, deve 


ser notado que a saída de um sistema diná- 
mico pode ser não estacionária simplesmente 
devido à ação da função forçante. Em ou- 
tras palavras, o sistema em si está fixo (es- 
tacionário ou invariante no tempo), mas por 
causa do sinal de entrada, que pode ser for- 
temente não estacionário, a saída pode tam- 
bém se tornar não estacionária. Em tais ca- 
sos, a maioria dos métodos de modelagem 
não apresentam bom desempenho se apenas 
o sinal de saída for utilizado para se cons- 
truir um modelo autônomo. Entretanto, se 
a lei dinâmica que rege a relação entrada- 
saída do sistema for invariante no tempo, um 
modelo não autônomo pode ser obtido desde 
que o sinal de entrada esteja disponível. A 
representação NARMAX polinomial, a ser 
descrita na próxima seção, permite proceder 
dessa forma. 


9.3 Representações 
Matemáticas 


Deve-se notar que a sigla NARMAX vem do 
inglês Nonlinear AutoRegressive Moving Ave- 
rage models with eXogenous inputs, e indica 
apenas que tipo de regressores (variáveis in- 
dependentes) são usados pelo modelo, mas 
nada diz sobre a classe da função não linear, 
indicada por F a seguir. 

Além da representação NARMAX poli 
nomial, há várias outras que podem ser uti- 
lizadas para implementar FW, tais como re- 
des neurais multi-camadas (MLP) (Bakker 
et al., 2000), funções de base radial (RBF) 
(Mees, 1993), coordenadas modais (Thou- 
verez e Jezequel, 1996), redes de wavelets 
(Cao et al., 1995; Billings e Coca, 1999), 
modelos exponenciais autoregressivos (Galka 
e Ozaki, 2001) e funções racionais (Corrêa 
et al., 2000). No caso em que as funções 


de ativação de redes MLP são polinomiais, 
sabe-se que tais redes podem ser representa- 
das como modelos NARX polinomiais (Chon 
e Cohen, 1997). Por fim, observa-se que nem 
todas essas representações levam em conta o 
ruído no modelo e, estritamente falando, de- 
veriam ser referidas como NARX ou NAR 
(no caso de sistemas autônomos). A se- 
guir algumas representações são menciona- 
das com mais detalhe. 


9.3.1 O preditor linear local 


Seja a série temporal y(1), y(2), ..., y(N) 
tomada de um atrator de dimensão D de um 
sistema dinâmico de ordem n. O ponto de 
partida no desenvolvimento de um preditor 
linear local é realizar a imersão da série tem- 
poral como, por exemplo, usando coordena- 


das de atraso: 


y(k) = [y(k) ylk—) ... y(k — (de Dr)", 
(9.1) 
em que de é a dimensão de imersão e T é o 
tempo de atraso. 'Takens mostrou que uma 
imersão com de > 2D é “boa” genericamente 
no sentido de que existe um diffeomorfismo 
entre o objeto no espaço original e o objeto 
reconstruído no espaço de imersão de dimen- 
são de. Veja os capítulos 6 e 7 para uma 
discussão mais detalhada de assuntos relaci- 
onados à reconstrução do espaço de estados. 
Antes de mencionar o problema de predi- 
ção, é importante notar que valores vizinhos 
no espaço de imersão correspondem a jane- 
las temporais em que os dados são parecidos. 
Isso está ilustrado no exemplo a seguir. 


Exemplo 9.3.1 


Um aspecto fundamental de entender em 
problemas de imersão e de modelagem é 
que pontos vizinhos no espaço de imersão 
correspondem a trechos semelhantes na 
série temporal. O objetivo deste exemplo 
é ilustrar esse ponto. 

Para tal, foi simulado o sistema de 
Lorenz com intervalo de integração de 
ót = 0,008 e foi usada apenas a variá- 
vel x. Fez-se a imersão em um espaço 
de três dimensões (para permitir fazer o 
gráfico), portanto, de = 3 e o tempo de 
atraso usado foi 7 = 8. Portanto, os ve- 
tores são da forma 


2 (k) = [(k) v(k—7) u(k=20)]", 


em que x é a variável x do sistema de 
Lorenz e k indica o instante mais adi- 
antado usado na formação de x(k). Em 
torno de 1800 desse vetores são mostra- 


dos na Figura 9.1.Usar k — 7 ou k+T é 
indiferente. Um ponto foi escolhido arbi- 
trariamente e foram procurados os pon- 
tos vizinhos dentro de um raio e = 1,52. 
Esse valor é aproximadamente 4% da ex- 
cursão do atrator ao longo do eixo x. Fo- 
ram encontrados 14 vizinhos, indicados 
na Figura 9.1 com círculos vermelhos. 
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FIGURA 9.1: Pontos no espaço de imer- 
são para o sistema de Lorenz usando a va- 
riável x. Círculos no canto superior direito 
indicam os 14 vizinhos encontrados para um 
ponto escolhido arbitrariamente. 


A Figura 9.2 mostra um trecho da sé- 
rie temporal utilizada. O primeiro con- 


junto de três círculos vermelhos à es- 
querda correspondem ao vetor 


2(k) = [7(816) x(808) x(800)]". 


Os outros dois conjuntos de três cír- 
culos, são os dois vizinhos consecutivos 
detectados pelo algoritmo. Como pode 
ser notado na Figura 9.2 esse conjunto 
de pontos vizinhos corresponde a trechos 
semelhantes na série temporal. 
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FIGURA 9.2: Trecho da série da variável x 
do sistema de Lorenz. Os círculos em verme- 
lho indicam três pontos vizinhos no espaço 
de imersão. 


Um preditor Z(k + 1) = F(x(k)), 
portanto, forneceria a estimativa %(817). 
O procedimento é ilustrado no Exem- 


plo 9.3.2. 


Se as coordenadas em (9.1) forem adequa- 
das, um alvo viável é procurar um modelo 
suave F:Rº SIR 


G(k + 1) = Fly(h)), (9.2) 


em que o chapéu indica a saída do modelo. 

Logo, supõe-se que existe uma função F que 

mapeia um ponto no espaço de imersão no 

próximo ponto na série temporal. Claramente, 
com y(k+1) estimado, tem-se uma estima- 

tiva do próximo ponto no espaço de imersão: 


V(k+1) = [9(k+1) y(k=7+1) ... 
e y(k-(de-1)T+D]. (9.3) 


Um aspecto sutil, que muitas vezes passa 
sem ser notado, é que a distância temporal 
entre os elementos do vetor y(k) é 7, como 
visto em (9.1), mas muitas vezes a predição é 


feita apenas uma amostra k = 1 à frente. Ou 
seja, F em (9.2) toma valores espaçados de 7 
até o instante k e prediz o instante seguinte 
k+1. É possível também estimar um mapa 
tal que a predição seja 7 instantes à frente, ou 
seja, Y(k+7) = F(y(k)), o que corresponde a 
um modelo ajustado sobre dados decimados 
com fator 7. 

Uma das primeiras tentativas de formar 
F foi por meio de uma partição do espaço de 
imersão em vizinhanças (U;H>” dentro das 
quais a dinâmica pode ser aproximada por 
um mapa afim (F,;,b;) : IR“ +5 IR de modo 
que: 


y(k+1) = Fry(k)+b; (9.4) 
para y(k) EU, à = 1,...0,Na. 
(9.5) 


sendo que para cada vizinhança YU; há um 
mapa correspondente (F;,b;). No caso de 
(9.4) a predição também é um vetor, como 


ilustrado no Exemplo 9.3.2. 

Algumas alternativas para os mapas são 
polinômios lineares (Farmer e Sidorowich, 
1987; Abarbanel et al., 1990; Casdagli, 1991), 
aproximações de ordem zero, também conhe- 
cidos como preditores locais afins (Farmer e 
Sidorowich, 1987; Kennel e Isabelle, 1992) 
e preditores ponderados (Linsay, 1991). O 
Exemplo 9.3.2 ilustra como proceder para ob- 
ter um preditor local afim. 

Como consequência dessa abordagem, o 
preditor local linear não tem uma forma fe- 
chada, ou seja, não se trata de um modelo 
global. Assim, esse tipo de representação não 
permite, em geral, uma abordagem analítica. 


Exemplo 9.3.2 


Este exemplo dá continuidade ao Exem- 
plo 9.3.1. Em particular, a Figura 9.3 
mostra com círculos vermelhos os qua- 


torze pontos vizinhos indicados também 
com círculos vermelhos na Figura 9.1. 

A novidade na Figura 9.3 é que para 
cada um dos pontos vizinhos encontra- 
dos, os pontos imediatamente seguintes 
são mostrados também, mas com cruzes 
azuis. Portanto, o primeiro círculo — que 
foi arbitrado e em seguida usado como 
centro da vizinhança, a partir da qual 
foram encontrados outros trezes pontos 
= dê: 


(k) = [7(816) x(808) x(800)]”, 


e, o ponto imediatamente seguinte, indi- 
cado com uma cruz azul é: 


v(k+1) = [x(817) (809) x(801)]”. 


Qual dos círculos e cruzes correspondem 
a esses dois vetores não está indicado na 


figura. Procedendo de forma semelhante, 
são mostrados os quatorze vizinhos e seus 
catorze pontos seguintes. Dito de outra 
forma, tem-se pontos de uma vizinhança 
e as respectivas imagens obtidas sob a 
ação do campo vetorial. 

Deseja-se agora encontrar um mapa 
afim que, em termos médios, mapeie os 
círculos nas cruzes. Seja ai um vetor 
círculo e, portanto, pertencente à vizi- 
nhança definida. Seja a! o vetor seguinte, 
procuramos um mapa afim que resolva: 
el =Fal+b, FER ebeIRº. 

O mapa buscado deve ter um desem- 
penho médio aceitável em todos os pon- 
tos da vizinhança. O procedimento des- 
crito a seguir deve ser feito para cada 
uma das vizinhanças. Assim, buscamos 
um mapa que atenda em termos médios 


o conjunto de equações lineares 


2 = Fel+b 
= nx bb 


8 
| 


x = Fo +b, 


que pode ser escrita em forma matricial 
como: 


if 14 
Ele) = oo] 
XT = AM, (9.6) 


em que en CC Aemicms 
IR**!*. Transpondo (9.6) chega-se ao re- 
sultado: X = MA”. Resolvendo essa ex- 
pressão utilizando a pseudo-inversa tem- 


se: 


ÁT = (MTM) IMTX. 


(9.7) 
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FIGURA 9.3: Os círculos em vermelho indi- 
cam quatorze pontos vizinhos no espaço de 
imersão e as cruzes em azul são os pontos 
imediatamente seguintes a cada um. O cír- 
culo e cruz grandes são pontos de teste (ver 
texto). 


Como À” contém É e b, veja (9.6), é 


possível tomar um ponto teste, x!, den- 
tro da vizinhança e mapeá-lo usando o 
modelo, ou seja at, = Fa! +b. O ponto 
teste x! e sua imagem x! estão mostra- 
dos na Figura 9.3 com um grande cír- 
culo e uma grande cruz, respectivamente. 
Como pode ser visto, o mapa obtido pa- 
rece ser razoável. À validação de um pre- 
ditor local linear requer que esse proce- 
dimento seja feito para cada uma das vi- 
zinhanças definidas e que devem cobrir 
todo o domínio dos dados. Parte dos da- 
dos deve ser usada para estimar os mapas 
e outra parte para validar o preditor. 


9.3.2 Funções radiais de base 


Um dos primeiros trabalhos sobre a modela- 
gem de dinâmica caótica usando funções ra- 
diais de base foi publicado por David Bro- 
omhead e David Lowe (Broomhead e Lowe, 


1988). Nesse trabalho, um modelo típico tem 
a forma: 


u(k) = bo + > wi Al atk-1)-c ||), (9.8) 


i=1 


em que p é o número de funções de base, à. 
bo e w; são os parâmetros a determinar, c 
são os centros, que normalmente são escolhi- 
dos a priori, e || - || é a norma Euclidiana. 
A Figura 9.4b mostra esquematicamente um 
modelo desta classe, em que L indica uma 
função de ativação linear. 


Um outro trabalho pioneiro de grande im- 
pacto sobre o uso de funções radiais de base 
na modelagem de dinâmica não linear e caos 
foi publicado por Martin Casdagli (Casda- 
gli, 1989) em que os modelos têm a seguinte 


forma geral (compare com Eq. 9.8): 
p 
uk) = > wdllak-D-cl)+ 
i=1 


+ Do timpla), (9.9) 


em que p, é um polinômio de ordem n < d 
em que d é conhecido. Os parâmetros a de- 
terminar são w;, |in. Uma das contribuições 
de Casdagli foi a inclusão dos termos polino- 
miais em (9.9). Para a modelagem de dados 
dinâmicos essa inclusão é normalmente bené- 
fica. 


9.3.3 Redes neurais 


Uma rede neural é uma classe de modelos 
originalmente motivada na estrutura do cére- 
bro (ver Figura 9.4). Algumas simplificações 
para modelos do tipo perceptron são: i) usar 


uma única camada oculta (no contexto mais 
atual de deep learning tipicamente são usa- 
das mais camadas ocultas); ii) o nodo de 
saída é considerado linear, e iii) todas as fun- 
ções de ativação h da camada oculta são não 
lineares e iguais. Um modelo do tipo percep- 
tron pode ser descrito como 


m n 
ylk)=bo+3 ugh [| b+5  wiai(k—1) | (9.10) 

j=1 i=1 
em que Wi; são os pesos a serem estimados. 
Os subíndices indicam que a i-ésima entrada 
conecta-se ao j-ésimo neurônio da camada 
oculta. O peso wj conecta o j-ésimo neurô- 
nio da camada oculta à saída. Os parâmetros 
b; são termos constantes referidos como bias. 
Por fim n = dim(x) é a dimensão da camada 
de entrada e m é o número de neurônios da 
camada oculta. O lado direito de (9.10) tem 
características feed-forward, pois não há co- 
nexões recorrentes internas à rede. Note que 


(9.10) está na forma y(k) = fla(k—1)]. AI 
gumas das escolhas mais comuns para h são 
funções gaussiana, sigmoidal e tangente hi- 
perbólica. 


FIGURA 9. 4: Representação de três classes de modelos. (a) mo- 
delo perceptron típico, (b) modelo simples de funções radiais de base, 
(c) modelo com várias funções de base. As linhas contínuas correspon- 
dem a parâmetros que devem ser estimados. Linhas tracejadas indicam 
que não é necessário estimar parâmetros. Portanto (a) é não linear 
nos parâmetros, enquanto (b) e (c) são representações lineares nos pa- 
râmetros. Normalmente & depende de parâmetros. Quando esse é o 
caso, tais parâmetros podem ser escolhidos a priori. Fonte: (Aguirre e 


Furtado, 2007). 


Dentre os primeiros artigos sobre o uso 
de redes neurais na modelagem de dinâmica 
caótica estão (Albano et al., 1992; Elsner, 
1992). 


9.3.4 Polinômios em tempo 
contínuo 


Ao contrário do que aconteceu na área de 
controle, em sistemas dinâmicos não lineares, 
as primeiras tentativas de modelagem global 
a partir de dados foi utilizando equações dife- 
renciais ordinárias (Cremers e Hiibler, 1987). 
Diferentemente de Cremers e Hiibler, a mai- 
oria de artigos que se seguiram, ao invés de 
usar como base polinômios de Legendre, os 
autores passaram a usar modelos que se as- 
semelhavam a expansões em série de Taylor, 


como por exemplo (Breeden et al., 1990): 


Tt = f(x,y) = ago + mo + agy A 
aunty +... Ty +... 

y = g(v,y) = boo + boy + box 4 
buxy +... +byaly' +...(9.11) 


Uma representação parecida foi usada por 
Gouesbet que começou a investigar sob que 
condições é possível reconstruir campos ve- 
toriais nas coordenadas (X,Y, Z) a partir de 
uma única variável medida X = x de um 
campo vetorial original (x,y,z) (Gouesbet, 
1991; Gouesbet, 1992). Esse problema, hoje, 
sabe-se que equivale a um problema de obser- 
vabilidade (Letellier et al., 2005), como dis- 
cutido no Capítulo 7. Nessa representação, o 
sistema reconstruído é expresso como: 


X =Y 
jo sec (9.12) 
Z = F(X,YZ), 


que está na forma X=F(X,X,X) e é conhe- 
cida como forma jerk. Tanto aproximações 
racionais como polinomiais para HF foram in- 
vestigadas. Sabe-se que se F for polinomial, 
há um difeomorfismo global entre o atrator 
no espaço original e o atrator reconstruído. 
No caso de F ser racional, há pontos de sin- 
gularidade no espaço tais que o denominador 
de F se anula e, portanto, não é definido. 
Nesse caso, para tais pontos, não há um di- 
feomorfismo global. Nesse caso fala-se de di- 
feomorfismos locais, o que, do ponto de vista 
de observabilidade é um cenário pior (Letel- 
lier et al., 2005; Aguirre et al., 2018). 


Uma dificuldade associada a essa repre- 
sentação é a necessidade de estimar deriva- 
das a partir de dados, assunto tratado em 
(Gouesbet e Maquet, 1992) para o caso de 
dados sem ruído, e em (Gouesbet e Letellier, 
1994; Letellier et al., 2009) para dados com 
ruído. Outros trabalhos pioneiros nessa área 


são (Giona et al., 1991; Brown et al., 1994a). 


9.3.5 Polinômios em tempo 
discreto 


Um modelo NARMAX geral é definido da 


seguinte maneira 


ulk)=F [n(k—1), ogylk= ny) u(ko)... 
u(k—nu),e(k).. .e(k—ne)], 
(9.13) 


sendo n,, Ny € Ne OS máximos atrasos nos 
sinais de saída, entrada e ruído, respectiva- 
mente. d é o atraso puro de tempo, medido 
em períodos de amostragem T,. Além disso, 
u(k) e y(k) são, respectivamente, os sinais 
de entrada e saída. A variável e(k) repre- 
senta incertezas, ruído, e assim por diante. 
F'|.| é alguma função não linear de y(k), u(k) 


e e(k), tal como, polinomial, neural, dentre 
outras. 

O sinal de saída no modelo (9.13) dá ori- 
gem à parte AutoRegressiva ao passo que a 
entrada é a variável eXógena. Como o ruído 
e(k) não é conhecido, a implementação prá- 
tica de (9.13) é (Billings, 2013): 


y)= Fly(k-D,..y(k— ny), ulk — d)... 
u(k — nu), E(k — 1)... 
E(k — ne)] + E(k), (9.14) 


em que a variável aleatória € é o resíduo do 
modelo e dá origem à parte de média móvel 
(Moving Average). A utilidade dessa parte 
do modelo é detalhada na Seção 9.4.3. A te- 
oria de mínimos quadrados mostra que &(k) 
deve ser uma variável aleatória branca de ma- 
neira a se estimar parâmetros de forma não 
polarizada — ou não tendenciosa. Se e(k) 
for branco e gaussiano, o estimador de míni- 
mos quadrados apresenta variância mínima 


entre os estimadores lineares não tendenci- 
osos, mas essa consideração sobre e(k) não 
é uma restrição prática. De fato, frequente- 
mente e(k) não é branco e mesmo assim &(k) 
pode ser forçado a ser branco (Aguirre, 2015; 
Ljung, 1999). Se, por um lado, o fato de os 
resíduos serem brancos garante que o estima- 
dor não apresenta viés, mas isso não garante 
em geral que o modelo resultante tenha um 
bom desempenho dinâmico. Em outras pala- 
vras, bom desempenho estatístico não é sufi- 
ciente (e frequentemente não é sequer neces- 
sário) para se garantir um bom desempenho 
dinâmico (Aguirre e Billings, 1994). Mais de- 
talhes sobre validação de modelos são apre- 
sentados na Seção 9.5. 


Uma vez que os modelos NARMAX são 
generalizações de modelos lineares ARMAX, 
não é fácil identificar na literatura especiali- 
zada à origem de tal representação. No con- 
texto de identificação de sistemas não linea- 


res, duas das primeiras referências nas quais 
modelos NARMAX começaram a ser consi- 
derados são (Billings e Leontaritis, 1981; Par- 
ker e Perry, 1981). Nessas referências, como 
é de se imaginar, o foco é questões pertinen- 
tes à representação matemática em si e suas 
relações com modelos de blocos interconec- 
tados do tipo Hammerstein e Wiener. Um 
dos primeiros artigos que tratou da estima- 
ção de parâmetros para modelos NARMAX 
polinomiais parece ter sido (Billings e Voon, 
1984). Por fim, em 1985 as propriedades ma- 
temáticas da representação NARMAX foram 
discutidas em detalhe (Leontaritis e Billings, 
1985a; Leontaritis e Billings, 1985b), ainda 
que não houvesse qualquer preocupação com 
questões práticas tais como a escolha de es- 
trutura e a estimação de parâmetros. Tais 
questões, como discutido na próxima seção, 
atraíram a atenção da comunidade científica 
posteriormente. 


9.3.6 Funções racionais 


Em essência esses modelos explicam o sinal 
y(k) usando a razão de dois polinômios dis- 
cretos ao invés de um único polinômio como 
em (9.14). Essa mudança confere certas ca- 
racterísticas interessantes ao modelo, mas ao 
custo de uma série de desafios numéricos (Bil- 
lings e Chen, 1989; Zhu e Billings, 1991; Zhu 
e Billings, 1993). 

Modelos racionais em tempo contínuo fo- 
ram considerados em (Gouesbet, 1991), mas 
somente do ponto de vista analítico. Um dos 
únicos resultados do uso de tais modelos na 
representação de dinâmica caótica a partir de 
dados experimentais está descrito em (Cor- 
rêa et al., 2000). 


9.3.7 Wavelets 


Modelos wavelets têm semelhanças com os 
modelos com funções da base radiais, mas em 


vez de usar bases radiais, as funções usadas 
para compor o modelo são do tipo: 


1 t—b 

ali) = 5 ( - ) (915 
em que t,a,b € Re a > O. Assim os mo- 
delos wavenets são combinações lineares de 
funções wavelet ya, »(t). Como os modelos de 
base radiais, há diversas escolhas para a fun- 
ção W(t). Um dos primeiros trabalhos a usar 
wavenets na modelagem de dinâmica caótica 
foi (Cao et al., 1995) em que os autores utili- 
zaram uma wavelet do tipo chapéu mexicano 
para modelar vários sistemas numéricos com 
dinâmica caótica. Outros trabalhos usando 
essa representação são (Billings e Coca, 1999; 
Wei e Billings, 2004). 


9.3.8 Lógica difusa 


As variáveis internas de modelos que usam 
lógica difusa são linguísticas, em vez de nu- 


méricas. Portanto, em algum ponto da mo- 
delagem, tais variáveis devem passar por uma 
etapa de fuzzyficação durante a qual recebem 
valores linguísticos tais como: pequeno nega- 
tivo, grande positivo, etc. O cerne de um mo- 
delo com lógica difusa é um conjunto de re- 
gras do tipo: se x for grande, então y deve ser 
médio. Por fim, a saída produzida pela apli- 
cação desse conjunto de regras, que ainda é 
uma variável linguística, deve ser convertida 
em uma variável numérica, etapa conhecida 
com defuzzyficação (Campello e do Amaral, 
1999; Teixeira e Zak, 1999; Guillaume, 2001; 
Ballini e Gomide, 2002). 


De todas as classes de modelos mencio- 
nadas nesta seção, modelos de lógica difusa, 
tão utilizados em outras áreas, é a que foi 
menos explorada na modelagem de dinâmica 
não linear. Um dos primeiros artigos a li- 
dar com esse problema parece ser (Hiew e 
Tsang, 1994). Várias técnicas, incluindo mo- 


delos com lógica difusa, foram comparadas 
em (Santos et al., 2007) no contexto de pre- 
dição não linear. 


9.4 Desafios de Modelagem 


9.4.1 Escolha de estrutura 


A escolha das funções de base que compõem 
um modelo é um problema bastante antigo, 
especialmente na Estatística. A motivação 
original parece ter sido o ideal de encon- 
trar o conjunto ótimo de funções de base 
para explicar uma determinada variável. Na 
maioria dos casos, portanto, a condição de 
otimalidade era fundamentalmente estatís- 
tica — como pode ser constatado, não ape- 
nas para os critérios de informação (Akaike, 
1974; Rissanen, 1989), mas também em apli- 
cações de modelagem não linear (Korenberg, 
1988; Kortmann e Unbenhauen, 1988; Bil- 


lings et al., 1989). Em muitos casos, o de- 
sempenho ruim de modelos ao fazer predições 
livres se deve a uma escolha inadequada da 
estrutura do modelo ao invés de uma opção 
por esta ou aquela representação. Modelos 
com estrutura mal escolhida não apenas tem 
desempenho dinâmico ruim como facilmente 
se tornam instáveis durante a simulação li- 
vre (Aguirre e Billings, 1995a; Small et al., 
2002). 


A primeira referência ao método ortogo- 
nal de procura rápida (Fast Orthogonal Se- 
arch Method FOS), como ferramenta para 
a solução do problema de escolha de estru- 
tura para modelos polinomiais discretos, pa- 
rece ser (Korenberg, 1985). Depois tal algo- 
ritmo foi estendido para modelos vetoriais, 
ou seja, modelos multivariáveis que usam o 
mesmo conjunto de regressores (funções de 
base) para explicar mais de uma variável (Ba- 
garinao e Sato, 2002). Ao longo do tempo 


surgiram alternativas ao FOS, com pequenas 
variações no algoritmo e no nome, como por 
exemplo a taxa de redução de erro (Error 
Reduction Ratio ERR) (Billings et al., 1988; 
Korenberg et al., 1988) e a soma de regresso- 
res ao quadrado (Sum of Square Regressor) 
(Kortmann et al., 1988). Uma exceção pa- 
rece ser (Desrochers e Mohseni, 1984) em que 
um algoritmo ortogonal, diferente daqueles 
mencionados acima, foi proposto para seleci- 
onar, dentre uma biblioteca de termos candi- 
datos, os melhores termos para compor um 
modelo não linear contínuo no tempo. Um 
outro método diferente seleciona os termos 
baseado em análise de correlação (Kortmann 
e Unbenhauen, 1988). 


Outros conceitos e ferramentas para se 
escolher a estrutura de modelos NARMAX 
polinomiais foram sugeridos posteriormente. 
Em particular, o conceito de agrupamento de 
termos, como uma ferramenta complemen- 


tar, é digno de nota (Aguirre, 1994b; Aguirre 
e Billings, 1995b; Aguirre e Mendes, 1996). 
Tal procedimento foi usado com sucesso em 
diversas áreas tais como sistemas dinâmicos 
não lineares (Aguirre et al., 1997; Mendes e 
Billings, 1998) e processamento de sinais bi- 
omédicos (Corrales e Aunón, 2000). 


Outras tentativas de melhorar a escolha 
de estrutura de modelos polinomiais NAR- 
MAX são técnicas de busca exaustiva após 
uma escolha de estrutura preliminar (Men- 
des e Billings, 2001) e o uso de geometria afim 
(Lu et al., 2001). Em (Hong et al., 2008) o 
leitor encontra uma revisão de técnicas rela- 
cionadas. 


Um procedimento posterior trata de téc- 
nicas de aleatorização e estimação de funções 
de probabilidade para cada potencial regres- 
sor. Aqueles regressores que tenham maior 
probabilidade são utilizados para compor o 
modelo (Falsone et al., 2015; Avellina et al., 


2017; Retes e Aguirre, 2019; Fagundes et al., 
2022). 


9.4.2 Estrutura e dinâmica 


Os trabalhos citados na seção anterior pro- 
põem técnicas para ajudar a determinar uma 
boa estrutura para um modelo. A neces- 
sidade de se escolher a estrutura com cui- 
dado é reconhecida de forma geral, qualquer 
que seja a representação matemática utili- 
zada (Kadtke et al., 1993; Mees, 1993). Mas 
o que acontece se a estrutura de um mo- 
delo não está bem especificada? Nos primór- 
dios da modelagem matemática, a maldição 
de modelos sobre-parametrizados era o alto 
custo computacional e, quiçá, problemas as- 
sociados ao mal condicionamento numérico. 
Na atualidade, reduzir o custo computacio- 
nal não parece ser mais a melhor justificativa 
para motivar a busca por modelos mais com- 


pactos. Semelhantemente, algoritmos numé- 
ricos têm melhorado significativamente a ca- 
pacidade de se estimar parâmetros, mesmo 
para modelos grandes. 


De fato, parece que uma estrutura incor- 
reta normalmente resulta em más consequên- 
cias dinâmicas. Dentre os problemas grossei- 
ros cita-se a instabilidade dos modelos (con- 
sidere os resultados de (Rowlands e Sprott, 
1992) para constatar essa afirmativa). Um 
dos primeiros trabalhos que mostra e quanti- 
fica os efeitos dinâmicos da escolha indevida 
da estrutura de modelos parece ser (Aguirre 
e Billings, 1995a). Nesse artigo foi mostrado 
como a estrutura incorreta (ainda que leve- 
mente) afeta o diagrama de bifurcação do 
modelo de forma significativa. Além disso, o 
equívoco na estrutura não é revelado, em ge- 
ral, por invariantes geométricos tais como os 
expoentes de Liapunov e medidas de dimen- 
são fractal. Em (Aguirre e Mendes, 1996) foi 


mostrado que em casos particulares de defi- 
nição incorreta de estrutura o resultado é um 
padrão incorreto nos pontos fixos do modelo. 
Algumas dessas ideias foram posteriormente 
desenvolvidas por Mendes e Billings com o 
intuito de classificar formas diferentes de erro 
na definição da estrutura de modelos NAR- 
MAX polinomiais (Mendes e Billings, 1998; 
Mendes e Billings, 1997). 


Um problema correlato, mas que é segu- 
ramente mais difícil de resolver, é a escolha 
da representação matemática. O problema 
da escolha da estrutura só começa após de- 
finir a representação matemática. Modelos 
polinomiais podem ser aplicados em diver- 
sos problemas práticos com bastante sucesso. 
Entretanto, tal representação somente é ade- 
quada quando a dinâmica subjacente for mo- 
delável por polinômios (Aguirre, 1997). Por 
exemplo, é extremamente difícil ajustar um 
modelo polinomial a uma série de dados pro- 


duzida pelo mapa tenda, pois o mapa de pri- 
meiro retorno é um triângulo (o que lembra 
uma tenda) que, por sua vez, é difícil de apro- 
ximar por um polinômio. Em casos como 
esse, devem ser tentadas outras representa- 
ções. 


Sempre há quem cite o teorema de Wei- 
erstrass e argumente que se o polinômio tiver 
grau de não linearidade suficientemente ele- 
vada, qualquer função pode ser aproximada 
pelo polinômio. (Com respeito a isso, duas 
observações precisam ser feitas. Em primeiro 
lugar, à medida que se aumenta o grau de não 
linearidade de um polinômio, o problema da 
escolha de estrutura torna-se cada vez mais 
difícil de resolver. Esse cenário pode se agra- 
var a ponto de o problema de escolher a estru- 
tura tornar-se intratável. Quando o sistema 
modelado não for polinomial, esse problema 
se manifesta muito antes de se obter um bom 
modelo. Em segundo lugar, ajustar um mo- 


delo estático a uma função estática ou a um 
conjunto de dados é um problema regressão 
ou ajuste de curvas. Um problema muito di- 
ferente é ajustar um modelo dinâmico a uma 
(ou mais) série temporal e requerer que a si- 
mulação livre de tal modelo tenha caracte- 
rísticas dinâmicas semelhantes às do sistema 
que produziu os dados. Essas duas observa- 
ções também são pertinentes no contexto de 
outras representações matemáticas tais como 
redes neurais e funções de base radial. 


9.4.3 NARMA(X) ou NAR(X)? 


Esta seção aborda o problema da inclusão 
ou omissão da parcela de média móvel (MA) 
no modelo. Frequentemente refere-se a tal 
parcela como sendo o modelo de ruído. Os 
detalhes podem ser encontrados em (Aguirre, 
2015). 

Considere que o modelo a seguir foi ob- 
tido de um conjunto de dados corrompidos 


com ruído, e(k), que não é branco: 


É possível que os resíduos desse modelo, 
indicados por é(k), não sejam brancos. Se a 
função É for linear nos parâmetros, tais parã- 
metros podem ser estimados utilizando-se o 
estimador de mínimos quadrados (MQ). De- 
vido à propriedade de ortogonalidade de tal 
estimador (que força &(k) ser ortogonal ao 
hiper-plano gerado pelos regressores — que 
são as funções de base) e se o ruído não é 
branco, o estimador será tendencioso (pola- 
rizado). Intuitivamente, esse problema pode 
ser compreendido notando-se que, em princí- 
pio, &(k) deveria ser uma estimativa estocás- 
tica de e(k). O ruído e(k), que não é branco, 
terá projeção não nula sobre ao hiper-plano 
gerado pelos regressores do modelo (isso sig- 


nifica que parte desse ruído pode ser expli- 
cada), mas devido ao fato que E(k) é orto- 
gonal por definição,º tal “conflito” resulta em 
polarização. Uma forma de resolver esse pro- 
blema é decompor o ruído colorido em uma 
parcela completamente aleatória (branca) e 
uma parcela que pode ser modelada da se- 
guinte forma: e(k) = ea(k) + em(k), em que 
Ca(k) é a parte aleatória. A segunda etapa 
consiste de tentar modelar em(k) juntamente 
com o modelo, ou seja, essa parcela de ruído 
deve aparecer também dentro de É[-] e so- 
mente ea(k) é deixada de fora. A nova parte 
do modelo que agora aparece em É || é preci- 
samente a parte MA. Essa parcela é, eviden- 
temente, ortogonal à hiper-superfície gerada 
pelos regressores e, portanto, não há mais 
conflito ao se tentar aproximar de maneira 
estatística ea(k) com é(k). 


êEsta é uma propriedado do estimador de míni- 
mos quadrados (Aguirre, 2015). 


Uma observação importante é que o mo- 
delo de ruído, ou seja a parte MA do modelo, 
mesmo sendo vital na etapa de estimação de 
parâmetros, não deve ser usada em simula- 
ções livres do modelo, quando o objetivo é 
analisar dinâmica determinística. O papel 
do modelo de ruído é reduzir a polarização 
durante a estimação de parâmetros. Uma 
vez completada tal etapa, apenas a parte de- 
terminística do modelo deve ser utilizada na 
análise e simulação. 


9.4.4 Estimação de parâmetros 


Como mencionado na seção anterior, o esti- 
mador MQ somente produz estimativas não 
polarizadas se o erro (ruído) na equação de 
regressão for branco. Na prática tal situa- 
ção dificilmente se observa uma vez que ainda 
que o ruído de medição seja branco, ele apa- 
rece colorido na equação de regressão (Aguirre, 


2015). Portanto, o uso do estimador clássico 
de MQ não é recomendado de forma geral. 

Qual algoritmo alternativo usar depende 
do tipo de modelo que se deseja utilizar para 
explicar em(k). Uma situação comum é expli- 
car tal parcela do ruído usando-se um modelo 
do tipo média móvel (MA) 


em(k) = Glea(k — 1),...,ea(k — ne)].(9.17) 


Assim, tal modelo é incluído no modelo 
NARX, o que resulta em um modelo NAR- 
MAX. O problema passa a ser que e,(k) não 
se conhece. Conforme mencionado na seção 
anterior, &(k) é uma aproximação estocás- 
tica de ea(k) e em aplicações práticas pode 
ser utilizada em (9.17). Isso resolve um pro- 
blema, mas cria outro pois €(k) depende do 
modelo estimado F[.], como pode ser visto 
em (9.14). Portanto o modelo NARMAX 
deixa de ser linear nos parâmetros e passa 
a ser pseudo-linear nos parâmetros e um al- 
goritmo iterativo deve ser utilizado. Assim, 


o estimador estendido de mínimos quadra- 
dos (EMQ) é normalmente utilizado para es- 
timar os parâmetros de modelos NARMAX. 
Se o ruído for modelado como um processo 
AR ou ARMA, o estimador generalizado de 
mínimos quadrados (GMQ) deve substituir 
o estimador EMQ (Aguirre, 2015). Por fim, 
nota-se que há outros estimadores que não 
modelam o ruído de forma explícita, tal como 
o estimador de variáveis instrumentais (VI) 
(Soderstrôm e Stoica, 1989). 


9.5 Validação de Modelos 


O que é um bom modelo? Essa pergunta 
é difícil de responder de forma geral. Um 
determinado modelo só pode ser classificado 
como sendo “bom” dentro do contexto espe- 
cífico para o qual foi obtido. Em outras pala- 
vras, deve-se perguntar se um modelo é ade- 
quado para um determinado fim. Um modelo 


pode ser um excelente preditor, mas ser ina- 
dequado para análise ou para o projeto de 
controladores, e vice-versa. Portanto, tem-se 
outra pergunta: o que se espera do modelo? 
Se o objetivo do modelo é auxiliar na análise 
qualitativa do sistema em estudo, possivel- 
mente as características topológicas da diná- 
mica do modelo são mais importantes do que 
a habilidade do modelo fazer boas predições 
livres. Isso significa que medidas do desvio 
das características topológicas seriam mais 
relevantes do que, por exemplo, medidas do 
erro de predição. Algumas dessas ideias são 
descritas em maior detalhe na próxima seção, 
mas deve-se ter em mente que procurar uma 
resposta geral para a pergunta em questão 
não parece ser a forma mais adequada de se 
abordar o problema de validação de modelos. 


9.5.1 Medidas estatísticas, 
da geometria e 
da dinâmica 


Parece razoável classificar medidas de vali- 
dade de modelos em três classes: medidas 
estatísticas, medidas da geometria e medidas 
da dinâmica. 


Dentre as medidas estatísticas, encontram- 
se diversos índices de erro, análise de cor- 
relação de resíduos, análise de polarização- 
variância, dentre outros. A grande vantagem 
de tais medidas é que são fáceis de calcular e, 
em geral, não requerem conhecimento a pri- 
ori do sistema. O grande problema associado 
a esses indicadores, entretanto, é que mesmo 
bons índices — como por exemplo resíduos 
brancos, compromisso ótimo entre polariza- 
ção e variância — não garantem que o com- 
portamento dinâmico do modelo esteja pró- 
ximo ao do sistema. Um perigo é que tais ín- 


dices podem ser incluídos direta ou indireta- 
mente no processo de composição do modelos 
na forma de funções de custo a serem mini- 
mizadas na estimação de parâmetros. Con- 
sequentemente, é possível “forçar” bons índi- 
ces estatísticos sem garantir bom desempe- 
nho dinâmico. 


Dentre as medidas da geometria, citam- 
se os retratos de fases, diversas medidas de 
dimensão fractal, expoentes de Liapunov, se- 
ções de Poincaré, dentre outros. Em geral, 
é mais difícil obter modelos cujas medidas 
da geometria de seus atratores são próximos 
das respectivas medidas do sistema original, 
quando comparado a modelos que simples- 
mente têm bons índices estatísticos. Entre- 
tanto, tais invariantes também têm suas fa- 
lhas. Por exemplo, modelos (e atratores) 
muito diferentes podem ter dimensão frac- 
tal próxima. O mesmo é válido para o maior 
expoente de Liapunov. Outra dificuldade de 


ordem prática é que a fim de se fazer uma boa 
validação é necessário ser capaz de estimar 
tais invariantes para o sistema original com 
boa margem de confiança. As restrições asso- 
ciadas ao comprimento de séries temporais, 
boa relação sinal /ruído e, principalmente, es- 
tacionariedade colocam em cheque os valores 
estimados a partir dos dados reais. Deve-se 
notar que tal dificuldade não existe por parte 
dos modelos, uma vez que por simulação eles 
podem ser usados para gerar séries de dados 
tão longas quanto necessário, sem ruído e es- 
tacionárias (Aguirre e Billings, 1995c). 


Por fim, a título de medidas da dinâmica, 
citam-se aquelas propriedades que estão for- 
temente conectadas à dinâmica do modelo, 
tais como diagramas de bifurcação, mapas 
de primeiro retorno e diversas medidas da 
topologia do atrator. Vários exemplos po- 
dem ser encontrados na literatura em que 
modelos com medidas estatísticas e de ge- 


ometria muito semelhantes têm comporta- 
mentos dinâmicos muito distintos (Aguirre e 
Billings, 1994; Aguirre e Billings, 1995c; Le- 
tellier et al., 2002b). 


A fim de concluir a presente discussão, 
dois pontos são dignos de nota. Em primeiro 
lugar, apesar de ser frequentemente usada, 
a predição de um passo à frente é um indi- 
cador pobre para se validar a dinâmica de 
um modelo. O erro de predição de um passo 
à frente, que por definição são os resíduos 
do modelo, é uma medida de quão bem a 
referida estrutura matemática se ajustou à 
massa de dados utilizada para estimar os pa- 
râmetros, mas não há nessa medida nenhuma, 
garantia de que característica globais da di- 
nâmica do modelo tenham sido aprendidas 
dos dados. Mesmo usando predições de um 
passo à frente sobre dados de validação não 
é um procedimento exigente o suficiente. 


Nesse particular, predições livres são 


muito mais convenientes e devem, em ge- 
ral, ser preferidas em problemas de valida- 
ção. Em segundo lugar, o uso de sincroni- 
zação para validar modelos (Brown et al., 
1994b) não pode ser facilmente encaixado em 
alguma das classes acima. A ideia principal 
é que se a dinâmica do modelo estiver sufi- 
cientemente próxima à dinâmica subjacente 
aos dados então, pelo menos em princípio, 
o modelo deve ser sincronizável com os da- 
dos. Essa ideia parece não ter sido desen- 
volvida significativamente — provavelmente 
por não se ter uma medida absoluta para 
se quantificar o que é estar suficientemente 
próxima —, mas certamente parece ser uma 
forma interessante de tentar validar modelos. 
Esse assunto foi investigado por Edgar Fur- 
tado e colegas (Furtado, 2004; Aguirre et al., 
2006) que constataram que sincronismo com 
dados é útil para validar modelos somente se 
uma medida de esforço for usada simultanea- 


mente. Não somente isso, esse critério é útil 
para comparar modelos, mas não se presta 
como uma medida de validade absoluta. 


9.5.2 O papel de perturbações 
induzidas 


Um conceito básico em identificação de sis- 
temas é que um modelo identificado deve ser 
considerado como sendo uma realização de 
uma família de modelos com aquela estru- 
tura em particular. Isso é uma consequência 
do fato de que os parâmetros do modelo tam- 
bém são uma realização de um conjunto de 
variáveis aleatórias. Isso significa que mo- 
delos que são estatisticamente equivalentes 
podem apresentar regimes dinâmicos aparen- 
temente distintos. Essa observação justifica 
uma série de ações que chamamos de “pertur- 
bações induzidas” e que objetivam procurar 
melhores modelos na vizinhança de modelos 


previamente identificados. Isso também pa- 
rece servir de justificativa para a procura de 
modelos em duas etapas (Mendes e Billings, 
2001). 


Os resultados de diversos artigos recentes 
podem ser interpretados sob essa ótica. Edu- 
ardo Mendes esteve entre os primeiros a su- 
gerir que, ao se variar um dos parâmetros es- 
timados de um modelo é possível, em alguns 
casos, obter-se o atrator desejado (Mendes 
e Billings, 1997). Esse resultado foi inves- 
tigado também em (Aguirre et al., 2002b), 
onde mais de um tipo de representação ma- 
temática foi utilizada. Nessa referência foi 
mostrado que um modelo identificado a par- 
tir de dados experimentais pode ser levado a 
bifurcar diversas vezes (cascata de duplica- 
ção de período de ciclos) variando-se um dos 
parâmetros estimados dentro de uma faixa 
definida por mais e menos um desvio pa- 
drão. Em outras palavras, todos os mode- 


los assim obtidos podem ser interpretadas 
como perturbações “estatisticamente equiva- 
lentes” do modelo originalmente identificado. 
Além disso, a sequência de bifurcações é exa- 
tamente a mesma que a observada no sistema 
real variando-se um dos parâmetros físicos. 


Essas ideias têm implicações em proble- 
mas de validação de modelos. Por exemplo, 
em (Chon et al., 1997), polinômios NARX 
foram obtidos para os quais uma perturba- 
ção externa foi utilizada para levar o modelo 
identificado a produzir uma saída mais pró- 
xima à desejada. Em (Nepomuceno et al., 
2003) foi utilizada uma técnica de otimiza- 
ção multiobjetivo na estimação de parâme- 
tros com a finalidade de “perturbar” o mo- 
delo identificado. Nesse artigo foi mostrado 
que ao se variar o peso relativo de dois ob- 
jetivos durante a estimação de parâmetros, 
é possível se obter uma família de modelos 
Pareto-ótima que apresentam regimes diná- 


micos diferentes — mas da mesma classe — 
alguns mais próximos da dinâmica desejada. 
Em (Mendes e Billings, 2001), o número de 
termos de ruído, o número de dados e a va- 
riância do ruído foram usados para “pertur- 
bar” modelos identificados e levá-los, no es- 
paço de parâmetros, a regiões de melhor de- 
sempenho. Não obstante, deve ser obser- 
vado que nenhuma das “perturbações” usa- 
das nos artigos acima mencionados alteram 
a estrutura do modelo. Em outras palavras, 
tais perturbações ocorrem no espaço de pará- 
metros, mas não no espaço de estruturas de 
modelos. A variação do tempo de amostra- 
gem (ou tempo de discretização de modelos 
contínuos) também é uma perturbação que 
induz diversos regimes dinâmicos em mode- 
los (Mendes e Billings, 2002; Letellier et al., 
2004; Letellier e Mendes, 2005). 


Um problema que tem recebido alguma 
atenção na literatura, ainda que usando di- 


versas representações matemáticas, é a re- 
construção de diagramas de bifurcação a par- 
tir de dados (Cao et al., 1997; Bagarinao 
et al., 1998; Bagarinao et al., 1999; Small 
et al., 2003). 


Resumindo, ao se utilizar “perturbações” 
cuidadosamente escolhidas, em muitas situa- 
ções diferentes é possível melhorar o desem- 
penho de modelos quando o modelo original 
está suficientemente perto de um bom mo- 
delo. Além disso, é possível utilizar tais per- 
turbações para reconstruir diagramas de bi- 
furcação a partir de modelos obtidos exclusi- 
vamente de dados. A relação com validação 
de modelos é a seguinte: se um modelo com 
desempenho aparentemente ruim passa a ter 
um bom desempenho pela ação de algum tipo 
de perturbação (no sentido discutido e ilus- 
trado acima) conclui-se que tal modelo estava 
suficientemente perto de um bom modelo e, 
portanto, não era tão ruim quanto se pen- 


sava. 


9.6 Exemplos Numéricos 


A presente seção foi preparada a partir da 
Seção 16.2 da referência (Aguirre, 2015). Ao 
longo desta seção modelos estimados são apre- 
sentados. O leitor deve considerar que o nú- 
mero de casas decimais indicadas podem não 
ser suficientes para reproduzir os resultados 
numéricos. Portanto esses modelos são apre- 
sentados com fins ilustrativos. 


9.6.1 O circuito de Chua 


O circuito de Chua é um dos sistemas mais 
utilizados na atualidade como paradigma para 
o estudo de dinâmica não linear e caos. Esta 
seção trata da construção de modelos para 
esse circuito a partir de dados originalmente 


levantados e usados em (Aguirre et al., 1997) 
e disponíveis em (ChuaDatal.zip): 


O circuito em si está mostrado na Fi- 
gura 9.5a e é composto de componentes line- 
ares, à exceção do diodo de Chua, que é um 
dipolo com a característica linear por partes 
mostrada na Figura 9.5b. Tal componente 
tem resistência negativa e é o elemento que 
confere energia ao sistema permitindo, assim, 
manter o circuito oscilando autonomamente. 

Portanto, no circuito de Chua, a não li- 
nearidade é devida à presença do diodo de 
Chua, que na prática pode ser implementado 
utilizando-se amplificadores operacionais e ou- 
tros componentes simples (Tôrres e Aguirre, 


2000). As equações que descrevem o circuito 
são: 


dvo, Vc, — Vo 
(es E E ( C E 6; ) —ia(ve) 
dvo (ave). 
Cs Frades R + 
di 
Ls = vo, (9.18) 


sendo que vc, é a tensão sobre o capacitor C;, 
iz é a corrente no indutor e a corrente que 
passa pelo diodo de Chua é: 


movc, + Bp(mo — ma) se vo, <-—Bp 
id(vcy) = mIVC4 se lvcy |< Bp (9.19) 
movc, + Bp(m, — mo) se vc, > +Bp- 


FIGURA 9.5: O circuito de Chua. (a) o circuito 
de Chua e (b) característica corrente-tensão me- 
dida para o diodo de Chua implementado. 


O seguinte conjunto de parâmetros pode 
ser utilizado para simular o circuito de forma 
a se aproximar do protótipo que foi montado: 
€1=10,0nF, €,5=100nF, L=19,2mH e R é 
um trimpot de 2,0kQ. O diodo de Chua foi 
montado usando-se dois amplificadores ope- 
racionais, conforme sugerido em (KENNEDY, 
1992), tendo sido medidos os seguintes va- 
lores para os parâmetros: mo = —0,37 + 
0,04mS, m; = —0,68 + 0,04mS e B, = 1,1+ 
DV: 


Variando-se o trimpot R, o circuito apre- 
senta diversos regimes dinâmicos, tais como 
pontos fixos estáveis, oscilações periódicas e 
dinâmica caótica. Dois exemplos de regimes 
dinâmicos caóticos são mostrados nas Figu- 
ras 9.6 e 9.7. Essas figuras mostram os da- 
dos imersos no plano de fase. Tal recurso é 
útil para a análise de sinais caóticos, uma vez 
que a variável tempo não é representada no 
plano de fase. Nesse plano, a ênfase é a re- 


presentação dos diversos padrões dinâmicos 
envolvidos. Padrões diferentes normalmente 
resultam em atratores com geometria dife- 
rente. 


9.6.2 Identificação monovariável 


Esta seção descreve a identificação de regi- 
mes dinâmicos do circuito de Chua a partir 
de medições. Deve ser notado que a identifi- 
cação é feita a partir de apenas uma variável, 
ou seja, os modelos resultantes serão autôno- 
mos. Uma consequência disso é que os mo- 
delos devem ser interpretados como modelos 
de regimes dinâmicos específicos e não do sis- 
tema de forma global, como ocorre no caso 
de os modelos serem não autônomos. 


RE 1 2 3 4 
FIGURA 9.6: Atrator dupla-volta (dsvct O), 
obtido para R = 1.8000, reconstruído a partir 
de 1.500 observações da tensão em volts sobre o 
capacitor C4 do circuito de Chua. 
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FIGURA 9.7: Atrator espiral (spvci 0), ob- 
tido para R = 1.9000, reconstruído a partir de 
1.500 observações da tensão em volts sobre o ca- 
pacitor C4 do circuito de Chua. 


Modelos polinomiais NARMAX 


A identificação e análise dos dados mostra- 
dos nas Figuras 9.6 e 9.7 foi estudada e do- 
cumentada em detalhes nos trabalhos (RO- 


DRIGUES, 1996; AGUIRRE et al., 1997). No 
caso dos dados da Figura 9.6, a tensão sobre 
o capacitor C, foi amostrada em intervalos 
de 12 us, resultando numa série temporal de 
3.000 pontos, sendo usada apenas uma janela 
de 1.000 observações para obter o seguinte 
modelo: 


e(k) = 3,5232(k—1) —4,2897 x(k—2) —0,25882(k—4)-1,77842(k— 1)? 
+2,06522(k—3) + 6,1761 x(k—1)2a(k—2) 

+0,1623 a(k— Da(k-2)x(k—4)-2, 7381 x(k—1)22(k—3) 
—5,5369 a(k— 1)z(k—2)2+0,1031 2(k— 2)? 

+0,4623 a(k—4)3 —0,5247 a(k—2)20(k—4) 

—1,8965 a(k— Dx(k—3)2+5,4255 a(k— Dx(k-2)x(k—3) 
+0,7258 a(k—Dax(k—4)2—1,76842(k— 3)a(k— 4)? 


+1,1800 «(k—3)2e(k—4) + Vg (k — 1)06 + E(k), (9.20) 


sendo que WZ(k — 190: é a parte MA (média 
móvel) do modelo incluída a fim de reduzir 
o viés do estimador (Aguirre, 2015). O uso 
de x(k) indica que tais modelos foram iden- 
tificados a partir de observações da variável 
x do circuito, correspondente a vc, (t). 


Semelhantemente, o modelo 


v(k) = 0,23382x 10 2w(k—1)—0,26888x 10 2(k—2)+0,18154x 10 2(k—3) 
—0,50374 2(k— 4) —0,174982(k— 5) — 0,37064 
—0,191057(k— 1)z(k— 5) +0,25216x 10“ o(k— 1)z(k—3)zx(k—5) 
—0,30255x 10 1 e(k— 1)a(k—4)2+0,168562(k— 2)x(k— 3) 
-0,0402 »(k— 1)z(k—1)-0,03142(k—1Dx(k—1)x(k—5) 
+0,02785 2(k— 2)? v(k—3) + WE (k—1)de + E(k) (9.21) 


foi identificado a partir dos dados mostra- 
dos na Figura 9.7, amostrados com T,=20 us. 
Comparando-se as Figuras 9.6 e 9.7 com 9.8 
e 9.9, respectivamente, percebe-se que os mo- 
delos (9.20) e (9.21) parecem ter capturado 
o comportamento dinâmico dos respectivos 
atratores. 
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FIGURA 9.8: Atrator dupla-volta do modelo 
(9.20) identificado a partir dos dados da Fi- 
gura 9.6. 
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FIGURA 9.9: Atrator espiral obtido simulando- 
se o modelo (9.21) identificado a partir dos dados 
da Figura 9.7. 


Trechos dos sinais correspondentes às Fi- 
guras 9.6 e 9.8 estão mostrados na Figura 9.10 
e percebe-se que comparar séries temporais 
medidas e simuladas torna a validação mais 
difícil nos casos em que o sistema em estudo 
é sensível às condições iniciais, como é o caso 


de sistemas com dinâmica caótica. 


Os pontos fixos do atrator dupla volta 
são três. Um ponto fixo é trivial e os ou- 
tros dois que são simétricos com respeito 
à origem. No espaço original, que é tridi- 
mensional, os pontos fixos são: (Vc,, Vc, iLF 
10,0,0t e f—Tc,, —Tc,, —iL), em que as bar- 
ras indicam valores em estado estacionário. 
Os valores estão indicados na Tabela 9.1. 


Como os modelos são identificados a par- 
tir de apenas uma variável, no melhor dos 
casos é possível representar (do ponto fixo 
no modelo) a coordenada correspondente à 
variável usada. Ou seja, se vc, é a variável 
observada, então espera-se que o modelo te- 
nha um ponto fixo perto de 1,88V (e não 
15,6mV ou -1,04mA). De fato, o modelo 
(9.20) tem um ponto fixo em 2,24V. Como 
o modelo é de quarta ordem, esse ponto fixo 
no espaço em coordenadas de atraso IRº é: 


DAVA VV, 224 VI). 


Tabela 9.1: Pontos fixos de modelos identifi- 
cados. 


atrator localização de pontos fixos 
Dupla-volta (1,88V, 15,6mV, -1,04mA + 
Dupla-volta toV, OmV, OmA ) 
Dupla-volta (-1,88V, -15,6mV, 1,04mA ) 
Eq. 9.20 2,24V, 0V, -2,24V 
Espiral f-2,24 V, 17,55mV, -1,17mA |) 
Eq.9.21 -8,72V, -1,79492,9V, -1,79-92,9V 


(a) 
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FIGURA 9.10: Séries temporais do atrator 


dupla-volta obtidas a partir (a) dos dados da 
Figura 9.6 e (b) da simulação do modelo iden- 
tificado (9.20). Note como, devido ao fato das 
oscilações serem caóticas, a comparação das sé- 
ries temporais torna-se mais difícil. 


No caso do modelo (9.21), há dois pon- 
tos fixos complexos conjugados. Em se tra- 
tando de dados reais, esse resultado, apesar 


de não ser crítico, não é o mais desejável. 
Deve ser notado que o ponto fixo em -2,24V 
é aproximado pelo modelo (9.21) em -3,72V. 
Observe-se que os dados sobre o atrator espi- 
ral não visitam as vizinhanças dos três pon- 
tos fixos do sistema. Consequentemente, os 
dois pontos fixos dos quais não há informa- 
ção nos dados são aproximados pelo modelo 
por um par de pontos fixos complexos conju- 
gados. A justificativa de o modelo (9.21) ter 
pontos fixos complexos e as alterações neces- 
sárias na estrutura do modelo no sentido de 
contornar o problema podem ser encontrada 
em (Aguirre e Mendes, 1996; Mendes e Bil- 
lings, 1998). 


Modelos racionais NARMAX 


Os dados usados na seção anterior foram uti- 
lizados para identificar modelos racionais NAR- 
MAX. Um modelo identificado foi (Corrêa, 


1997): 


1 
ul) = 5 (25568u(s D=1,7594y(k— 2) 


—1,0219 y(k— 2) — 3,2455 y(k— 


0,2696y (kk — 5) +0,6192y(k — 1)? 


Pu(k—5)+0,0735 y(h— 3)? 


+0,3444 y(k— Dy(k—5)2 —0,4401 y(k— 2)y(k — 5)2 


+3,4624 y(k— Dy(k —2)y(k— 5)4 


+0,1986 vlk—1)y(k—2)) 


10 5 
+> dk D+) dje(k — 5)? + (6), (9.22) 
i=1 j=1 
sendo 
D=1+1,5164y(k-— Dy(k-—2)+,5657y(k 


—2,0470 y(k— Dy(k—5). 


3)y(k—5)—12,8527y(k— 2)? 


+0,1948 y(k— 1)2+1,7662 y(k — 2)y(k — 5) — 0,1409 y(k — 5)? 


(9.23) 


Simulando-se o modelo mostrado nas 
Eq. 9.22 e 9.23 resulta em oscilações caóticas, 
tomando-se como condições iniciais valores 
do conjunto de dados usados para a identifi- 
cação. Representando-se os dados simulados 
no plano de fase resulta na projeção do atra- 
tor mostrada na Figura 9.11. 

Os pontos fixos do modelo racional mos- 
trado nas Eq. 9.22 e 9.23 estão em zero e 


+2,37. Comparando-se o desempenho do mo- 
delo racional mostrado anteriormente com o 
modelo polinomial (9.20), observa-se que este 
é superior em alguns aspectos. 


0 
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FIGURA 9.11: Atrator dupla-volta obtido 
simulando-se o modelo mostrado nas Egs. 9.22 
e 9.23 identificado a partir dos dados da Fi- 
gura 9.6 (Corrêa, 1997). 


Modelos polinomiais contínuos 


Modelos contínuos foram obtidos a partir de 
observações medidas a uma taxa de 300 Hz 
da tensão vc, com tempo de amostragem T; = 
1/300s corresponde aproximadamente a 100 
observações por pseudoperíodo, resultando no 
atrator mostrado na Figura 9.12a. 

A implementação do circuito usada na 
presente seção difere da implementação des- 
crita anteriormente, uma vez que agora 
utilizou-se um circuito do tipo gyrator no lu- 
gar do indutor (Tôrres e Aguirre, 2000; Tôr- 
res, 2001b; Tórres e Aguirre, 2005). É pos- 
sível implementar indutores ativos que cor- 
respondem a indutores com elevada indu- 
tância. A consequência prática é a possibi- 
lidade de ter oscilações mais lentas, o que 
permite trabalhar com taxas de amostragem 
mais baixas. 

Os dados obtidos desse circuito foram uti- 
lizados na identificação. As derivadas do si- 


nal foram estimadas ajustando-se polinômios 
localmente e derivando-se esses polinômios 
(Aguirre, 2015). O número de centros, ou 
seja, o número de restrições utilizadas para 
estimar os parâmetros foi de 900. Estes fo- 
ram escolhidos igualmente espaçados ao longo 
de uma janela de 9.000 observações. Um mo- 
delo de 29 termos foi obtido com o auxílio do 
algoritmo da taxa de redução de erro (ERR) 
(Billings et al., 1989; Freitas, 2001). A pro- 
jeção do atrator obtido por simulação do mo- 
delo contínuo identificado é mostrada na Fi- 
gura 9.12b. 


FIGURA 9.12: Atrator dupla-volta (a) medido, 
sendo X=ve,(t) e Y = ve, (t) (b) simulado. 


À primeira vista, as projeções dos atra- 


tores parecem próximas. A Figura 9.13, por 
sua vez, mostra os mapas de primeiro retorno 
do oscilador real e do modelo. Algumas di- 
vergências nos referidos mapas são visíveis, o 
que indica pequenas diferenças na dinâmica 
não linear do modelo em relação ao sistema. 
Deve ser notado que as variáveis usadas na 
determinação dos mapas de primeiro retorno 
são distintas, e consequentemente as escalas. 
Entretanto, as características qualitativas ge- 
ométricas são as mesmas independente da va- 
riável usada. 


200 


FIGURA 9.13: Mapa de primeiro retorno do 
atrator dupla-volta (a) medido e (b) simulando- 
se o modelo contínuo identificado (Aguirre et al., 
2000). 


9.6.3 Identificação multivariável 


Nesta seção são mostrados modelos polino- 
mias discretos e contínuos. Em ambos os ca- 
sos, as três variáveis de estado do circuito de 
Chua foram usadas na identificação. Os re- 
sultados são modelos multivariáveis que têm 
uma equação para determinar cada variável 


de estado. 


Modelos polinomiais NARMAX 


Para gerar o conjunto de termos candidatos, 
o grau de não linearidade escolhido foi igual 
a 3, e o maior atraso nas variáveis de estado 
também igual a 3. O algoritmo ERR, (Bil- 
lings et al., 1989; Aguirre, 2015) foi usado 
para escolher entre os regressores candida- 
tos. O seguinte modelo foi obtido a partir de 
1.000 observações em cada variável de estado 
do circuito de Chua: 


a(k) = 1,41849527(h— 1) +3,2374889x 1022(k— 1) +0,98067833y(k— 1) 
—4,7499981x 10 2x(k— 1) — 2,7300719x 102z(k— Dy(k— 1)? 
—34,345366z(k— 1)x(k— 1)? +6,4982704x 10! y(k— 1)z(k— 1)?, 

y(k) = 0,7380129y(k— 1) —9,747613x 102 z(k— 1)º +0,1928916x(k — 1) 
+2,5991648x 1022(k— 1)— 1,7734303 x 10 “a(k— 1)? 
—4,43949252(k — 1)y(k— 1D)z(k— 1) — 7,2840942(k — Dy(k— 1)2, 


z(k) = 0,83251968z(k— 1) — 9,6925468x 10 “y(k—1) 


—1,2168819x 10 “a(k—1)+1,7476943x 10 Ex(k—1)2. (9.24) 


Note-se que o máximo atraso escolhido 
por esse critério é igual a um. O número de 
termos por equação foi escolhido por simu- 
lação dos modelos obtidos. Além dos termos 
indicados no modelo (9.24), foram usados dez 
termos de resíduo, de cada variável, em cada 
equação para reduzir o efeito de polarização 
(Aguirre, 2015). A Figura 9.14 mostra o 
atrator obtido por simulação do modelo iden- 
tificado (9.24). 


FIGURA 9.14: Atrator dupla-volta simulado. 
Foi usado o modelo (9.14), que consegue repro- 
duzir as oscilações caóticas no formato de dupla- 
volta. 


Modelos polinomiais contínuos 


Nesta seção foram usadas as três variáveis de 
estado vc,, vc, e ir, registradas a uma taxa 
de 300 Hz, como mostrado na Figura 9.15a. 


Trechos de 3.000 observações de cada variá- 
vel foram filtrados usando-se um filtro But- 
terworth, passa-baixa de quarta ordem, com 
frequência de corte em 18,3 Hz (Freitas, 2001). 
O atrator após a filtragem dos dados é mos- 
trado na Figura 9.15b. As derivadas foram 
determinadas ajustando-se polinômios por re- 


gressão a janelas de cinco pontos. 

Para a identificação propriamente dita, 
foram escolhidos 1.300 centros, igualmente 
espaçados ao longo das 3.000 observações. O 
grau de não linearidade máximo foi igual a 
três. Um dos modelos obtido é: 


voy = 48,000, —7,48X 1007 +12,900, —2,58 vê, +3,38xX 1077 vo,» 


3,71 x 1047 vc, + 11,200, +3,74x 10!ip — TB vc,, (9.25) 
2 


vcs 


4 


ir = —2,00 x 10209, + 8,81 x 1022 vc, — 5,12 x 107205, 


As Egs.9.25 foram integradas partindo- 
se das mesmas condições iniciais dos dados 
de identificação, gerando um conjunto de 10º 
pontos. O atrator desse modelo é mostrado 
na Figura 9.16. 


FIGURA 9.15: Atrator dupla-volta medido e fil- 
trado. (a) atrator dupla-volta medido usando-se 
uma implementação do circuito de Chua. (b) da- 
dos filtrados com filtro de Butterworth de quarta 
ordem. Os eixos correspondem às variáveis de 
estado do circuito. 
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FIGURA 9.16: Atrator dupla-volta simulado 
usando-se o modelo (9.25). 


Comparando-se os atratores original (Fi- 
gura 9.15b) e do modelo estimado (Fi- 
gura 9.16) pode-se ter a impressão de que são 
bastante diferentes, especialmente no que se 
refere à trajetória próximo aos pontos fixos 
não triviais. Essa diferença é numérica e per- 
feitamente compatível com o nível de incer- 


teza existente nos dados. Variando-se um pa- 
râmetro do modelo estimado dentro da faixa 
de confiança do valor estimado pode-se ob- 
ter atratores menos (Figura 9.15b) ou mais 
(Figura 9.16) desenvolvidos (Aguirre et al., 
2002b). Para comparar desvios, ainda que 
sutis, na dinâmica um procedimento eficaz 
é comparar o mapa de primeiro retorno em 
cada caso e também realizar análise topoló- 
gica dos atratores (Letellier et al., 1996). 


9.7 Aplicações e 
Tendências 


A gênese da modelagem NARMAX com téc- 
nicas ortogonais parece ter se dado na co- 
munidade de controle de processos. Por essa 
razão, é mais que natural que os primeiros 
exemplos usando dados experimentais sejam 
relacionados a processos não lineares. Um 


dos artigos mais antigos que não usa dados 
simulados nos exemplos é (Kortmann et al., 
1988), em que os dados são de um alto-forno. 
Desde a publicação desse artigo, diversos exem- 
plos foram relatados que incluem a mode- 
lagem e análise de sinais biomédicos (Coo- 
per, 1991; Noshiro et al., 1993; Barahona e 
Poon, 1996; Chon et al., 1997; Aguirre et al., 
1999; Corrales e Auión, 2000), transduto- 
res acústicos (Jang e Kim, 1994; Potirakis 
et al., 1999), processos químicos (Próll e Ka- 
rim, 1994), sensores virtuais (Aguirre et al., 
2017), sistemas robóticos (Santos et al., 2018), 
sistemas com histerese (Abreu et al., 2020), 
dentre outros. 


Com respeito a sistemas dinâmicos não 
lineares, um trabalho pioneiro foi publicado 
por Crutchfield e McNamara em que apre- 
sentam exemplos de modelos polinomiais dis- 
cretos de duas variáveis do tipo NAR (Crut- 
chfield e McNamara, 1987). Nesse trabalho 


encontra-se um exemplo que usa dados de 
medição. Entretanto, os modelos apresenta- 
dos não são dos sistemas originais (os oscila- 
dores de van der Pol e de Duffing), mas são 
dos respectivos mapas de Poincaré. O mesmo 
tipo de modelo foi obtido em (Kadtke et al., 
1993) para o mapa de Hénon utilizando téc- 
nicas de seleção de estrutura semelhantes às 
mencionadas neste capítulo. 


Em (Aguirre e Billings, 1994) descreve-se 
a modelagem NARMARX polinomial aplicada 
a séries temporais obtidas a partir do pro- 
cesso de amostragem de sistemas em tempo 
contínuo. Apesar de o foco de tal artigo não 
ter sido a identificação de dinâmica não linear 
e caos, em tal trabalho modelos polinomi- 
ais NARMAX identificados para o sistema de 
Duffing-Ueda foram comparados utilizando- 
se retratos de fases, seções de Poincaré, di- 
agramas de bifurcação, o maior expoente de 
Liapunov e dimensão de correlação. Tal tra- 


balho parece ter sido o primeiro artigo so- 
bre a identificação (na realidade, sobre vali- 
dação) de um sistema caótico utilizando mo- 
delos NARMAX polinomiais. Uma discussão 
mais completa sobre o problema de identi- 
ficação de sistemas caóticos foi apresentada 
em (Aguirre e Billings, 1995c) em que sete 
sistemas foram identificados e validados. O 
primeiro exemplo da identificação de mode- 
los NARMAX polinomiais a partir de da- 
dos medidos de um sistema caótico parece 
ser (Aguirre et al., 1997). Os mesmos da- 
dos desse artigo foram utilizados em (Corrêa 
et al., 2000) para a identificação de mode- 
los NARX racionais. Tal artigo parece ser o 
primeiro a relatar a identificação de modelos 
racionais a partir de dados medidos. 


9.7.1 Desafios 


É difícil indicar claramente quais são proble- 
mas que permanecem abertos na modelagem 
de modelos polinomiais NARMAX. Melho- 
rias nos algoritmos numéricos usados para 
escolher a estrutura e estimar os parâmetros 
sempre são bem-vindas. Entretanto, parece 
que os grandes desafios são outros. 
Especialmente para aplicações com siste- 
mas dinâmicos não lineares, seria muito bem- 
vindo ter relações que conectem a estrutura 
do modelo e seus parâmetros com o tipo de 
regimes dinâmicos que tais modelos são capa- 
zes de produzir. Esse tipo de informação tem 
uma aplicação dupla. Por um lado, permite 
ao usuário extrair informação, de um modelo 
identificado, na forma de relações matemáti- 
cas. As fórmulas gerais que relacionam mo- 
delos polinomiais NARX aos seus pontos fi- 
xos (Aguirre e Mendes, 1996) ou à não line- 
aridade estática do sistema (Aguirre et al., 


2002a) são alguns exemplos disso. Por ou- 
tro lado, tais relações podem ser utilizadas 
para se restringir o modelo durante o pro- 
cesso de identificação. Um exemplo em que 
a informação referente aos pontos fixos foi 
usada no processo de identificação foi recen- 
temente discutido em (Nepomuceno et al., 
2003). Ou outro exemplo usando informação 
sobre a não linearidade estática pode ser en- 
contrado em (Corrêa et al., 2002). Tais resul- 
tados são preliminares e generalizações dos 
mesmos são importantes contribuições para 
a área. Uma discussão introdutória para mo- 
delos polinomiais, na perspectiva de duas dé- 
cadas de desenvolvimento, pode ser encon- 
trada em (Aguirre, 2022). 


Por fim, a extensão dos resultados men- 
cionados acima para sistemas multivariáveis 
e o uso de modelos polinomiais NARMAX na 
descrição de sistemas espaço-temporais são 
grandes desafios. Resultados preliminares na 


área de sistemas espaço-temporais foram pu- 
blicados recentemente em (Coca e Billings, 
2001). 


Um assunto interessante é o de chavear 
modelos simples, por exemplo lineares, de 
modo a alcançar dinâmica caótica com al- 
gumas propriedades previamente definidas 
(Amaral, 2006; Amaral et al., 2006; Amaral e 
Nepomuceno, 2018). Um estudo de caso não 
caótico, em que a superfície de chaveamento é 
estimada conjuntamente com os parâmetros 
dos modelos locais foi descrita em (Barbosa 
et al., 2018). 


Deixando um pouco o contexto de mo- 
delos polinomiais NARMAX, vale mencionar 
o uso mais recente de técnicas conhecidas 
como Reservoir Computing. Em (Lu et al., 
2018) os autores modelam o sistema de Lo- 
renz e validam o modelo convincentemente 
utilizando o mapa de primeiro retorno. Em 
(Pathak et al., 2017) os expoentes de Lia- 


punov são estimados a partir de um modelo 
válido construído a partir de dados. Thiago 
Ushikoshi usou esse tipo de estrutura mate- 
mática para modelar o oscillador de Duffing 
e validou os modelos usando seções de Poin- 
caré (Ushikoshi, 2022). 


Outro tema que tem surgido nos últimos 
anos é o uso de modelos contínuos com ordem 
fracionária (Tenreiro Machado et al., 2010; 
Salgado, 2015). Em princípio, a parte fra- 
cionária da ordem do modelo pode ser usada 
como parâmetro de bifurcação para obter so- 
luções topologicamente equivalentes às do cor- 
respondente modelo de ordem inteira (Letel- 
ler e Aguirre, 2013). Contudo, a simula- 
ção numérica de equações diferenciais de or- 
dem não inteira (fracionária) tem seus desa- 
fios teóricos e numéricos (Salgado e Aguirre, 
2016; Mendes et al., 2019). 


Leitura Recomendada 


Ao contrário de outros capítulos, neste as re- 
ferências foram citadas ao longo do texto, em 
função de sua característica de texto de revi- 
são. 


A Sociedade Brasileira de Automática é 
responsável por editar o periódico interna- 
cional Journal of Control, Automation and 
Electrical Systems pela Springer. Esse pe- 
riódico até 2012 era publicado somente no 
Brasil com o nome Controle €& Automa- 
ção. Dois trabalhos majoritariamente sobre 
o tema deste capítulo foram publicados nesse 
periódico pelo autor (Aguirre, 1996). Uma 
visão geral sobre aspectos de identificação de 
sistemas está disponível em (Aguirre, 2022), 
ao passo que uma abordagem detalhada pode 
ser encontrada em (Aguirre, 2015). 


Uma versão preliminar deste capítulo, em 
que a ênfase foi a aplicação de modelos po- 


linomiais NARMAX na modelagem de siste- 
mas dinâmicos não lineares foi originalmente 
publicada em (Aguirre, 2004). Uma versão 
semelhante em português foi publicada em 
(Aguirre, 2003). 

O leitor interessado pode baixar disserta- 
ções e teses completas de: 


https://www.ppgee.ufmg.br/bancodefesas.php 


esses trabalhos abordam modelos polinomi- 
ais (Rodrigues, 1996; Jácome, 1996; Cassini, 
1999; Corrêa, 2001; Saraiva, 1999; Barroso, 


2001; Nepomuceno, 2002), redes multi-camada 
(Cruz, 1998; Amaral, 2001), funções racio- 
nais (Corrêa, 1997; Corrêa, 2001), bem como 
modelos polinomiais contínuos (Freitas, 2001) 
e echo state networks (Ushikoshi, 2022). 


Exercícios 


9.1. Mostre que, após a imersão, de pre- 
dição dinâmica pode ser abordado como um 
problema de ajuste (geométrico) de curvas. 
Dica: formule o problema diretamente no 
espaço de imersão de dimensão baixa, por 
exemplo de = 3. Considere que o espaço 
de imersão seja de coordenadas de atraso. 
Mostre que uma reta localmente ajustada em 
uma região desse espaço equivale a uma equa- 
ção de diferenças no tempo. 


Capítulo 10 


Sincronismo 


O aumento no número de publicações dedica- 
das ao assunto de controle e sincronismo de 
sistemas caóticos é notório. A literatura es- 
pecializada inclui milhares de trabalhos que 
tratam desses assuntos. Qualquer tipo de re- 
visão estaria fadada a ser por demais incom- 
pleta e superficial. Com isso em mente, o 
objetivo do presente capítulo é descrever al- 
guns resultados chave dentro desses temas. 


Em alguns casos, a importância dos métodos 
é principalmente histórica. Espera-se indicar 
ao leitor onde buscar mais informações sobre 
o assunto de sincronismo de osciladores. 


10.1 Sincronismo Idêntico 


A título de introdução a este empolgante 
tema, consideramos rapidamente a história 
do físico holandês Christian Huygens, a quem 
se atribui o primeiro relato do fenômeno de 
sincronismo. 

Uma das muitas atividades de Huygens 
era a de relojoeiro. Os melhores relógios que 
construiu eram relógios de pêndulo. Conta-se 
que ao terminar de consertar ou montar um 
relógio, Huygens o dependurava em uma das 
paredes de madeira de sua residência, junta- 
mente com os demais relógios. Um dia ob- 
servou algo interessante. Ao dependurar um 
relógio, seu pêndulo estava assíncrono com 


respeito aos pêndulos dos demais relógios que 
já se encontravam afixados na parede. Con- 
tudo, depois de algum tempo o pêndulo do 
último relógio passou a mover-se de maneira 
síncrona (em fase) com os demais. Qual era 
a causa desse sincronismo? 


Depois de alguns experimentos, muitos 
deles “fracassados”, Huygens percebeu que o 
sincronismo era efetuado graças às vibrações 
transmitidas pelos relógios e que eram propa- 
gados pela parede ao relógio que havia sido 
colocado ali por último. Mesmo contendo 
pouca energia, essas vibrações eram sufici- 
entes para, aos poucos, levar o novo relógio a 
bater em sincronia com os demais. As vibra- 
ções, portanto, constituífam-se no necessário 
acoplamento entre o conjunto de relógios e o 
novo. 


Basta ter uma ação de acoplamento (fraco) 
entre dois sistemas para que os mesmos pas- 
sem a operar de maneira síncrona? À intui- 


ção fornece uma resposta negativa a essa in- 
dagação, pela simples razão de que se dois 
sistemas forem muito diferentes, o acopla- 
mento disponível não é suficiente para o sin- 
cronismo. No caso dos relógios de Huygens, 
como a dinâmica intrínseca dos relógios era 
muito próxima — ou seja, o período natu- 
ral dos pêndulos deveria ser necessariamente 
muito parecido entre os relógios — bastava um 
pequeno acoplamento para garantir o sincro- 
nismo. 


Desde os dias de Huygens o tema de sin- 
cronismo entre dois osciladores é estudado, 
normalmente no cenário de osciladores perió- 
dicos. E se os osciladores forem caóticos? É 
possível sincronizá-los? Ao longo da década 
de 1980 Hirokazu Fujisaka e Tomoji Yamada 
escreveram uma série de quatro artigos em 
que investigaram com detalhes o problema 
de sincronismo completo de osciladores caó- 
ticos idênticos (Fujisaka e Yamada, 1983; Ya- 


mada e Fujisaka, 1983; Yamada e Fujisaka, 
1984; Fujisaka e Yamada, 1986). Em 1990, 
sem o conhecimento dos trabalhos existen- 
tes sobre sincronismo de osciladores caóti- 
cos, Louis Pecora e Thomas Carroll publi- 
caram um artigo que atraiu grande atenção 
da comunidade e que é comumente anunci- 
ado como o primeiro a investigar constatar 
o sincronismo idêntico (ou completo) de os- 
ciladores caóticos (Pecora e Carroll, 1990). 
Na próxima seção descrevemos brevemente 
as contribuições desse trabalho. 


10.1.1 Conceitos preliminares 


Começamos definindo a forma de sincronismo 
mais intuitiva, mas, como veremos, é uma 
das mais difíceis de se obter. Considere dois 
osciladores indicados por à = fi(x1), 24 E 
Rº e àx = f(x), q» € IR”. Supondo que 
tais osciladores estejam acoplados de alguma 


forma, dizemos que estão em sincronismo idên- 
tico ou sincronismo completo após um certo 
instante to se mi(t) = ao(t), Vt > to. 

Supondo que os osciladores são de ter- 
ceira ordem, ou seja, n=3 e chamando suas 
variáveis de estado de (x,y,2), define-se o 
erro de sincronização como: 


e(t) = [21-22 y—42, 2—29]". (10.1) 


No caso de sincronismo idêntico tem-se que 
et) = 0, Vt > to. 

Na prática a condição para se ter sincro- 
nismo idêntico é muito difícil de ser aten- 
dida. Contudo, para valores pequenos de e(t) 
dizemos que os osciladores estão sincroniza- 
dos. Para um valor suficientemente pequeno 
0 <e< 1 pode-se usar como condição para 
sincronismo: 


Lhe, (10.2) 


tt) |) 


em que | ele || x || são as normas (2? do 
vetor de erro e do vetor de estado, respec- 
tivamente. À condição (10.2) assume que 
a trajetória nunca passa pela origem. Uma 
condição que não requer essa consideração é 
(Tórres, 2001a): 


et) | 
le()+1| 
em que O <e< 1 éa classe de sincronismo. 
Assim, se dois osciladores acoplados atendem 
à condição (10.3), dizemos que pertencem à 
classe de sincronização e. 


<eVWtDto, (10.3) 


10.1.2 O método de 
Pecora e Caroll 


No artigo publicado em 1990, do qual to- 
mamos emprestado o título para esta seção, 
Pecora e Carroll consideraram três sistemas 
caóticos: o de Lorenz, o de Róssler e um cir- 
cuito experimental. O tipo de sincronismo 


considerado por eles, bem como o dos traba- 
lhos anteriores, é o sincronismo idêntico ou 
completo, no qual as trajetórias no espaço de 
estados dos osciladores convergem. A formu- 
lação proposta, considera um sistema autô- 
nomo & = f(x). Particionando, o vetor de 
estado x = [x7 a;|”, podemos representar o 
sistema como: 


Um segundo sistema pode ser formado da se- 
guinte forma: 


Note que a primeira parte dos sistemas é 
idêntica e, na segunda, as variáveis em &,, 
que pertencem a S; foram impostas a S,. Es- 
ses sistemas diferem nas variáveis em £, € 


! 


x',. Portanto o erro de sincronismo é e = 


(x), — &w), € se 


lim e>50, 


t—>00 


diz-se que S, e S5 estão em sincronismo idên- 
tico. Como as variáveis em x, são impostas 
ao segundo sistema, a convergência é trivi- 
almente verificada. A dinâmica da diferença 
(x), — Zw) quando esta é pequena pode ser 
analisada pela equação vetorial linearizada 

(equações variacionais) 
é ms OfvlZo mw) (10.4) 

ÕX 
Os sistemas, mais precisamente os subsis- 
temas x e x, sincronizarão se os expoentes 
de Liapunov referentes ao subsistema %w fo- 
rem todos negativos. Esses expoentes foram 
chamados de subexpoentes de Liapunov por 
Pecora e Carroll, e mais tarde passaram a ser 
chamados de expoentes de Liapunov condici- 
onais. Esse resultado foi enunciado como um 


teorema, em que a condição de que os subex- 
poentes sejam negativos é apenas necessária. 


Ao relatar os resultados, os autores 
referem-se a x, como o subsistema de aciona- 
mento e x, como o subsistema de resposta 
(ou acionado). Para o sistema de Róssler, 
usando como sinal de acionamento a variá- 
vel y, ou seja, %, = y, Os subsistemas de 
tesposta er; = (2) ex, = (ray 
cronizam. Os subexpoentes de Liapunov re- 
ferentes a (1,2) são negativos. No caso de 
escolher x, = «x um dos subexpoentes é posi- 
tivo, e para x, = z ambos são positivos. Em 
nenhum desses casos foi possível encontrar 
sincronismo, segundo esses autores. Para o 
caso do sistema de Lorenz, foi possível cons- 
tatar sincronismo para Z, = Le X, = y, mas 
não para x, = z. À falta de sincronismo para 


sin- 


o caso em que z é usada para acionar o subsis- 
tema de resposta pode ser entendida ao lem- 


brar que a partir de medições de z somente, 
perde-se a informação de simetria, que é uma 
importante característica do sistema de Lo- 
renz. 

Um elemento chave no sincronismo entre 
dois osciladores é o acoplamento. No caso 
investigado por Pecora e Carroll o “acopla- 
mento” corresponde à substituição dos esta- 
dos x, por x,. Esse esquema veio a ser cha- 
mado de substituição completa e é difícil de 
implementar na prática. Há outros esquemas 
de acoplamento mais fáceis de usar. 

Por fim, Pecora e Carroll mostraram re- 
sultados do sincronismo de dois circuitos ele- 
trônicos. A presença de resultados experi- 
mentais e, ao contrário dos artigos de Fuji- 
saka e Yamada, a falta de detalhes e desen- 
volvimentos matemáticos possivelmente se- 
jam razões pela intensa e rápida aceitação do 
artigo. O próximo exemplo ilustra o cálculo 
dos subexpoentes de Liapunov. 


Exemplo 10.1.1 


Este exemplo é baseado em (Aguirre e 
Letellier, 2016). A seguir detalha-se uma 
forma de estimar os expoentes condicio- 
nais de Liapunov. O procedimento é ilus- 
trado para o sistema de Róssler quando a 
variável x é usada no esquema de substi- 
tuição completa. O sistema “mestre” de 
onde tomamos a variável de acionamento 
é: 


ti => hH-—-A 
S1 3 ya = Pi et 
& =b+a(xi—o), 


sendo (a,b,c) = (0,398; 2,0;4,0) e o osci- 


lador acionado (“escravo”) é 


tt =-“W—a 
So 3 y2 = Td GU 
29 = b+ zo(x1 —c), 


sendo que £, = Z1, Ly = (y, 21)" ex, = 
(y2, 229)". A variedade transversal é dada 
por (Pecora et al., 1997): y =w — We 
Zz1=2—22. Assim a dinâmica de erro é 
dada por 3, = xi +ayy — (xi +Hay>) = ay 
ezi=b+talx—c)—-b-za(x—c)= 
(x4 — c)z1. Usando a nomenclatura de- 
finida anteriormente, e = [yi 21]. A 
condição (y1,21) = (0,0) indica sincro- 
nismo completo, ou seja, a dinâmica do 
erro deve ser assintoticamente estável na 
vizinhança desse ponto. Portanto, line- 
arizando a dinâmica do erro em torno 


desse ponto tem-se: 


BlefatA olé 
“A UN iate (y1,21)=(0,0) e 


a ú a a (10.5) 


(compare com a Eq. 10.4). Os autovalo- 
res da matriz jacobiana, por ser diagonal, 
podem ser obtidos diretamente: ae x —c. 
Por fm, uma estimativa para os expo- 
entes de Liapunov condicionais pode ser 
obtida tomando-se a média dos autova- 
lores ao longo de uma trajetória. Assim, 
A=0a=0,398eh=(7)-c=-3,569, 
sendo (x) a média temporal de x. Como 
A > 0 a condição necessária para se 
ter sincronismo idêntico, segundo o teo- 
rema de Pecora e Carroll (Pecora e Car- 
roll, 1990) não é atendida. Os expoentes 
de Liapunov condicionais para o caso em 


que as variáveis de acionamento são y, e 
21 podem ser estimados de maneira aná- 
loga (ver Exercício 10.1). 


10.2 Sincronismo de Fase 


Dados os estados de dois osciladores de 
mesma dimensão, se |, — x») — O dizemos 
que estão identicamente sincronizados. Por- 
tanto, sincronismo idêntico ou completo é a 
forma mais óbvia de sincronismo e também 
a mais exigente. Em 1996 um outro tipo de 
sincronismo em osciladores caóticos foi rela- 
tado. Esse sincronismo, chamado de sincro- 
nismo de fase, não é tão exigente e, por isso, 
é mais comum de ser verificado em situações 
práticas. 

Um dos pontos centrais em problemas de 
sincronismo de fase é obter uma estimativa 
de uma grandeza que associaremos ao con- 


ceito de fase. Para o sinal periódico us(t) = 
Asinwt, a fase instantânea é di(t) = wt. 
No caso de osciladores, o procedimento é um 
pouco mais elaborado e há várias formas de 
determinar a fase, dentre elas, a transfor- 
mada de Hilbert, usando-se uma seção de 
Poincaré, ou calculando (Boccaletti et al., 
2002): 


ó(t) = tan”! E) (10.6) 


se à fase estiver bem definida no plano x — y 
do oscilador em estudo. Numericamente, a 
função tan”! muda de sinal dependendo do 
quadrante. Deve-se tomar cuidado em garan- 
tir que a fase seja uma função monotonica- 
mente crescente. À cada revolução no espaço 
de estados, a fase deve aumentar 27. Em 
certas plataformas computacionais, a função 
atan está limitada ao intervalo [-7/2 m/2), 
ou seja, ao longo de uma revolução com- 
pleta há ao menos uma mudança de sinal. 


Parte dos problemas pode ser resolvida com 
o uso da função atan2, definida no intervalo 
[—7 7). 

Em muitos problemas é conveniente defi- 
nir à fase como uma grandeza que incrementa 
de 27 a cada “revolução pelo espaço de esta- 
dos”. Por enquanto usamos essa declaração 
sem maiores questionamentos, mas observe 
que ela requer que exista um centro em torno 
do qual se dão as revoluções o que é normal- 
mente verificado para um grande número de 
sistemas de fase coerente. Em poucas pala- 
vras, dizemos que um oscilador é de fase coe- 
rente se os tempos de primeiro retorno a uma 
seção de Poincaré tiverem uma pequena dis- 
persão, caso contrário dizemos que se trata 
de um oscilador de fase não coerente. Isso é 
ilustrado no próximo exemplo. 


Exemplo 10.2.1 


Aqui revisitamos o Exemplo 4.2.5, mas 
ao fazê-lo consideraremos tanto o regime 
espiral como o regime funil do sistema de 
Róssler. Para obter o regime funil usa- 
mos os parâmetros (a,b,c) = (0,398,2,4) 
e a seção de Poincaré P dada em (4.9). 
O retrato de fases e sua interseção com 
P é mostrado na Figura 10.1. 

Suponha que a trajetória cruze P nos 
instantes t,, ts, tu. ... Os tempos de pri- 
meiro retorno são definidos como ts—t,., 
tuts... Ou seja, o tempo de primeiro re- 
torno é o tempo de vôo entre duas inter- 
seções consecutivas com P. Para o caso 
de trajetórias periódicas, o tempo de pri- 
meiro retorno é constante. Como o atra- 
tor de Róssler é caótico, esperamos que 
haja alguma variabilidade nos tempos de 
primeiro retorno. Isso é confirmado pelo 


histograma mostrado na Figura 10.2. 
Seja yp à coordenada y sobre P para 
uma determinada condição, obtida como 
discutido na Subseção 4.2.2. Sejam y” e 
y" as coordenadas y dos pontos logo an- 
tes e logo depois de cruzar P, respectiva- 
mente. Os instantes de tempo correspon- 
dentes são t” e tt. Deseja-se encontrar o 
instante de tempo tp, no qual a trajetória 
cruza P. Note que devido ao processo de 
amostragem ou ao de integração numé- 
rica, os valores de tempo disponíveis são 


UIT SU. 


FIGURA 10.1: Atrator de Róssler em re- 
gime espiral e interseção com uma se- 
ção de Poincaré indicada em vermelho 
(QPoincRoss). 


A seguir estimamos t, por uma in- 
terpolação linear. Para isso, começamos 


montando a seguinte regra de três: 


sn = 
y" — Yp E t* — to. 


Resolvendo para tp, chega-se a: 


a 
uti 


fm e LE) 
Portanto, o tempo de primeiro retorno é 
calculado como a diferença de valores su- 
cessivos dos instantes em que a trajetó- 
ria cruza P. Os instantes são calculados 
usando (10.7). 

Como visto na Figura 10.2, apesar de 
os tempos de primeiro retorno do atra- 
tor espiral de Róssler não serem cons- 
tantes, por se tratar de um atrator caó- 
tico, a dispersão de valores não é grande. 
Ou seja, a trajetória leva um pouco mais 


de seis segundos para dar uma volta no 
atrator, sendo que esse tempo varia um 
pouco. Em outras palavras, a disper- 
são de frequências em torno da frequên- 
cia fundamental não é grande, ou ainda, 
a variedade de escalas de tempo é pe- 
quena. Isso caracteriza o atrator de Rós- 
sler no regime espiral como sendo de fase 
coerente, o que tem consequências per- 
ceptíveis em problemas de sincronização 
de fase, pois osciladores de fase coerente 
são mais fáceis de sincronizar em fase. 
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FigurA 10.2: Distribuição dos tempos 
de primeiro retorno do atrator de Róssler 
espiral (PoincRoss). 


Consideramos agora o atrator de Rós- 
sler no regime funil, que pode ser obtido, 
por exemplo, com (a,b,c) = (0,52,2,4), 
e é mostrado na Figura 10.3. Neste caso 


a seção de Poincaré P ainda é dada por 
(4.9). 

Deve ser observado que quando a tra- 
jetória entra no funil, ela dá algumas vol- 
tas antes de atravessar P. Por outro lado, 
quando a trajetória não entra no funil, 
ela retorna mais rapidamente em P. Por- 
tanto, não é surpresa que a distribuição 
de tempos de primeiro retorno seja bimo- 
dal, ou seja, composta de tempos curtos 
— quando não se entra no funil — e de tem- 
pos mais longos, quando se entra, como 
mostrado na Figura 10.4. 


FIGURA 10.3: Atrator de Róssler em 
regime funil e interseção com uma se- 
ção de Poincaré indicada em vermelho 
(QPoincRoss). 
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FIGURA 10.4: Distribuição dos tempos 
de primeiro retorno do atrator de Róssler 
funil (QPoincRoss). 


O fato de que os tempos de primeiro 
retorno para o atrator funil ocupam uma 
faixa ampla de valores resulta na classi- 
ficação desse atrator como sendo de fase 


não coerente. Na prática isso significa 
que há escalas de tempo bem diferentes 
no atrator, o que dificulta a definição da 
fase e também sincronizar em fase osci- 
ladores com essa característica. 


10.2.1 Sincronismo com 
uma força externa 


À situação, descrita a seguir, manifesta-se em 
um contexto diferente. Em primeiro lugar, 
não se trata da sincronização entre dois osci- 
ladores, mas entre um oscilador e uma força 
externa. O segundo aspecto diferente é o tipo 
de sincronização, que não mais é o idêntico, 
mas o de fase. 


Consideramos o caso de um oscilador no 


espaço IRº: 


t= fi(x)+ ut) 
y= fox) + ut) (10.8) 
Z= f(x) + ult), 


em que us(t) é uma função forçante como, 
por exemplo: us(t) = Asinwt com A ew es- 
colhidos cuidadosamente. Geralmente, usa- 
se somente uma função us(t) de cada vez 
e procuramos avaliar em que caso o sincro- 
nismo é alcançado de maneira mais fácil. 

Para isso, definimos faixas de valores de 
amplitude 4 E [Amin; Amax| e de frequên- 
cia w E [Wmin; Wmax] para investigar o sin- 
cronismo. Em geral, a condição para trava- 
mento de fase ou sincronismo estrito de fase 
é (Mormann et al., 2000): 


Prim = nya(t) EE mort) = K n;m E IN, 
(10.9) 
em que G;(t) é a fase instantânea do i-ésimo 
oscilador e K € IR é uma constante. Qnm É 


a fase relativa entre os osciladores 1 e 2. O 
termo normalmente usado em inglês para in- 
dicar o travamento de fases é phase locking, 
mas o uso desses termos, em inglês ou portu- 
guês ainda não é padronizado. 

Tomando a derivada temporal e, em se- 
guida, a média temporal, chega-se à condi- 
ção: 


(un) = (Onm) = oa(t) — mldr(t)) =0, 

(10.10) 
que é a condição de travamento de frequência. 
De modo geral, nos concentraremos no caso 
em que n = m = 1 chamado de sincronismo 
estrito de fase 1:1, cuja condição para escalas 
de tempo curtas é: 


Ioo(t) — dB = K, (10.11) 
e para escalas de tempo longas é: 


MM =D, (10.12) 


sendo N;=(w;)=(4;) à taxa de crescimento 
médio de fase do i-ésimo oscilador, que pode 
ser calculado como (Osipov et al., 2007, 
Eq. 4.46): 


o AD) — (0) 
= dim PO ESA = ns (10.13) 
As expressões (10.11) e (10.12) são as condi- 
ções para o travamento de fase e de frequên- 
cia, respectivamente. Tais condições rara- 
mente são verificadas na prática. Assim, a 
condição (10.11) é substituída por: 


ol) d(D|<K, (10.14) 


que foi proposta em (Rosenblum et al., 1996) 
e é conhecida como a condição de sincro- 
nismo amplo de fase, que é mais fraca que 
(10.11). Semelhantemente, podemos testar 
o sincronismo amplo de frequência usando 
[Mo—M|<e, O<e<1. Neste livro, o termo 


sincronismo de fase se refere ao sincronismo 
amplo de fase. Um termo em inglês comu- 
mente usado para indicar esse tipo de sincro- 
nismo é phase entrainment. O termo phase 
trapping também existe, mas é menos usado. 


Assim, o oscilador (10.8) é considerado 
sincronizado em fase no sentido amplo com 
a força externa se as duas condições forem 
simultaneamente verificadas (Osipov et al., 
2007, p. 82): 


[1-B|< 1058 


Ioo(t)— oa (t)| < 7. (10.15) 


À razão para a escolha K = 7 é que, quando 
as fases não estão sincronizadas, ocorrem es- 
corregamentos de fase com valores múltiplos 
de 27, logo 7 é suficiente para detectar tais 
escorregamentos. 

As condições em (10.15) indicam se o os- 
cilador está ou não síncrono com a força ex- 


terna. Uma medida de grau de sincronização 
é dada pela coerência média de fase (Mor- 
mann et al., 2000): 


1 N-1 E 
R= [+ >, io) + 


k=0 
1/2 


| N=1 E 
+ [+ De cos (6) (10.16) 


k=0 


em que T; é o tempo de amostragem e Gra(t) 
é a fase relativa. RE [0; 1] e R= 1 ocorre 
no caso de travamento de fase. 

A seguir testamos o sincronismo de fase 
de um oscilador com uma força externa 
us(t)=Asinwt para valores de 4 e w den- 
tro de limites especificados. Se o sincronismo 
for verificado para um par (A;,w;) usando 
(10.15), um ponto é indicado no plano A—w. 
A região nesse plano para a qual o sincro- 
nismo é verificado é chamado de domínio de 
sincronismo. 


Exemplo 10.2.2 


Neste exemplo usamos u,=A sin wt (veja 
Eq. 10.8) aplicada ao oscilador de Róôss- 
ler com frequência natural em torno de 
1,01, com A € [0; 0.1] e w € [0.98; 1.04]. 
Cinquenta valores em cada intervalo fo- 
ram usados, o que levou ao teste de 2500 
condições diferentes. Os resultados estão 
mostrados na Figura 10.5. À fase foi cal- 
culada usando (10.6). Para cada situação 
em que as condições (10.15) foram veri- 
ficadas, colocou-se um ponto no gráfico. 
O formato triangular do domínio de 
sincronização na Figura 10.5 lembra uma 
língua de Arnold. O resultado essencial 
por trás desse formato é que quanto maior 
for a diferença entre a frequência do si- 
nal externo e a frequência natural média 
do oscilador, tanto maior deve ser a am- 


plitude A para alcançar o sincronismo de 
fase. Isso, contudo, só se verifica para 
uma faixa relativamente estreita de va- 
lores de frequência. Ou seja, quando a 
diferença de frequências é maior que um 
certo valor, não adianta aumentar 4, que 
o sincronismo de fase não mais é possível. 


o, . | 
098 099 1 101 102 103 1.04 


Figura 10.5: Domínio de sincro- 
nização de fase para o oscilador de 
Róssler (10.26) com us(t)=Asinwt, e 
uy(t)=u:(t)=0, Yt. Os pontos indicam 
situações em que o oscilador sincronizou 
em fase com o sinal externo. 


Antes de vermos detalhes sobre o sincro- 
nismo de fase entre osciladores caóticos, dis- 
cutimos de maneira preliminar o conceito de 
fase, começando com osciladores periódicos. 


10.2.2  Osciladores periódicos 


Imaginemos um oscilador com frequência an- 
gular wo, portanto trata-se de um oscilador 
periódico senoidal. Se um sinal externo for 
aplicado ao oscilador, ou seja, se o oscila- 
dor for perturbado, sua frequência instantá- 
nea mudará como consequência da perturba- 
ção. Em meados do Século 20, Robert Adler 
propôs uma equação para investigar como 
a frequência instantânea do oscilador muda 
quando este é perturbado por um determi- 
nado sinal externo (Adler, 1946). O que veio 
a ser conhecido como a equação de Adler tem 
a seguinte forma geral: 


ó = wo — Bsen (q), (10.17) 


em que B é uma constante e d(t) é a fase 
do oscilador no instante t e, portanto, q é a 


frequência instantânea. Dada sua importân- 
cia histórica, o referido artigo de Adler foi 
reimpresso quase três décadas depois (Adler, 
1973). 


A fase de um oscilador periódico aumenta 
regularmente de 27 a cada período. No es- 
paço de estados, em que não se indica o 
tempo, a fase de osciladores periódicos pode 
ser vista também como uma função periódica 
com período 27. No caso de estudar o efeito 
de uma perturbação sobre a fase, é conveni- 
ente que a perturbação também seja perió- 
dica. A ideia é que se a perturbação sofrer 
um deslocamento temporal de 27, a situa- 
ção do ponto de vista da fase d(t) permanece 
inalterada. Assim é comum usar funções se- 
noidais como sinais externos ou de acopla- 
mento em estudos de sincronismo de oscila- 
dores, como fez Adler (veja a Eq. 10.17). 


O estado estacionário de (10.17) é dado 


por sen (4) = wo/B, ou ainda 
Q = arcsen wo, (10.18) 


em que se tomou B=1 por simplicidade. Se 
a condição em (10.18) for satisfeita e se o sis- 
tema for estável para tal condição, o oscilador 
“trava” na frequência constante wo. 

Consideremos um caso mais interessante, 
em que há dois osciladores como o investi- 
gado por Adler e que o sinal de acoplamento 
depende da diferença de fase entre os oscila- 
dores: 


dr = wy +esen(do—01) 
[ do — wo + esen (Py— 6»), ui) 


em que o ganho de acoplamento O<e<1. 
Como pode ser percebido, ao acoplar os os- 
ciladores como mostrado em (10.18), a ten- 
dência é forçar o travamento de fases (ver 
Exercício 10.5), ou seja, |bi—$>|=c, sendo c 
uma constante. 


Iniciemos a análise considerando os osci- 
ladores desacoplados, ou seja, e=0. Os dois 
sistemas oscilam de maneira independente 
com frequências wj rad/s e wa rad/s, respec- 
tivamente. Nesse caso, a fase do i-ésimo osci- 
lador cresce a uma taxa constante G;=w;t+ci;, 
em que w; e c; são constantes. A menos que 
wj=wa, à diferença de fase entre os oscilado- 
res cresce indefinidamente. Apesar de w/=w» 
e a diferença de fase ser constante, não há sin- 
cronismo, pois não existe acoplamento entre 
os sistemas. 

Passemos agora a considerar o caso aco- 
plado, ou seja, O<e<1. Cada oscilador está 
sob o efeito de uma função forçante. Para 
verificar esse efeito consideremos que a dife- 
rença de fase é suficientemente pequena tal 
que sen (do—d1)=02—41. Nesse caso a pri- 
meira equação em (10.19) pode ser escrita 
como: 


di mw +eldo — Qi). 


Portanto, se 4y for maior que 95, a parcela 
forçante terá o efeito de reduzir dr e even- 
tualmente reduzir 94. Em outras palavras, 
o acoplamento usado em (10.19) tem efeito 
regulatório. A mesma análise pode ser feita 
para o segundo oscilador. 

Se o efeito é regulatório, é natural inqui- 
rir sobre o ponto de equilíbrio e sua estabili- 
dade. Para investigar essa condição, devemos 
subtrair a primeira equação em (10.19) da se- 
gunda e, chamando O = do—d, e À = wa—uwr, 
tem-se: 


0= A -—2esen6, (10.20) 


que está na forma da equação de Adler (com- 
pare com a Eg. 10.17). Na condição de equilí- 
brio, os dois sistemas oscilam à mesma frequên- 
cia, ou seja, di=d». Nessa condição, que cor- 
responde aos pontos fixos de (10.20), pode 
haver um defasamento entre os osciladores, 
mas a diferença de fase é constante. 


No presente problema o que interessa é a 
diferença de fase 6 e não a evolução das fa- 
ses individuais, logo o espaço de interesse é 
unidimensional (ver Eq. 10.20) em vez de bi- 
dimensional, como em (10.19). Dito de outra 
maneira, o espaço de estados completo é bi- 
dimensional, mas interessa investigar o caso 
em que o sistema está limitado a uma va- 
riedade, chamada de variedade síncrona, em 
que |) — di] = c. Se as trajetórias em IR? 
convergirem para a variedade síncrona, então 
o comportamento síncrono é estável. Essa 
análise pode ser feita vendo se lim,-,oo 0-0. 
Ou seja, (10.20) deve ter uma condição de 
equilíbrio estável. Antes de procedermos a 
essa análise, mencionamos que (10.20) des- 
creve a dinâmica de erro, ou ainda, o com- 
portamento na variedade transversal à varie- 
dade síncrona (ver Exemplo 10.1.1). 


O ponto de partida é determinar a loca- 


lização de pontos fixos, que é dada por: 


0=0=A-2esend, 
A 
A=2esend .. send = (10.21) 


do = arcsen —, 


sendo que para haver solução o argumento da 
função arcsen deve estar em domínio válido, 
ou seja, 


(10.22) 


em que o sinal estritamente maior foi usado 
para evitar uma condição de “singularidade”. 
A expressão (10.22) mostra que para se ter 
um ponto de equilíbrio, o ganho da função 
forçante deve ter um valor mínimo, e que tal 
valor é diretamente proporcional à diferença 


entre as frequências naturais dos osciladores, 
A. Esse resultado confirma a intuição de que 
quanto mais diferentes forem as frequências 
dos osciladores envolvidos, tanto mais custa 
atingir o sincronismo. Para valores de e me- 
nores que tal valor crítico, não existe condi- 
ção síncrona em estado estacionário. Além 
disso, o estado estacionário, indicado pelo 
erro de fase 09 é diferente de zero se A 0. 
De modo geral, quanto maior for A, tanto 
maior é a diferença de fase entre os oscila- 
dores em estado estacionário, se a condição 
síncrona for atingida. 


Note que sen$=sen (7—0). Usando essa 
relação em (10.21) é possível encontrar um 


outro ponto de equilíbrio: 


A 
E Em ES 
sen (7 — 0) E 
eo nes = 
T arcsens- 
RR 
T — arcsen 5. 


A seguir é investigada a estabilidade das 
condições de equilíbrio 0) e 07. A derivada 
parcial do campo vetorial (equivalente à ma- 
triz jacobiana para o caso de dimensão maior 
que um) é: 


al = —2ecos0 e 30 aa = —2ecos 0,. 
=UQ 

Como 0, deve estar no domínio da função ar- 
cosseno —7/2 < 0, < 7/2, então cosdy > 0 
e —2ecos0, < 0. Logo, o ponto de equilíbrio 
do é estável. Pelo mesmo procedimento, e ob- 
servando que 0, É [-7/2, 7/2], (cos0,<0), 
conclui-se que 0, é instável. 


Verificaremos a seguir se ocorre uma bi- 
furcação em função de variações de parâme- 
tros. Uma condição para isso é 


of 
26 ecos0=0 .. cos09=0 


e ARO A 
2 


no intervalo —7<0<7, a bifurcação ocorre 
para 06= + 7/2. No ponto de bifurcação 
os ponto de equilíbrio coincidem. Além 
disso, nessa condição 09 perde estabilidade, 


tornando-se 0,. Para o caso 0=7/2 tem-se: 


do = 5 = arcsen — 
A 
1 = — “ 2=A. 
Ze 
E T 
0x >> — = — —— 
5 T — arcsen E 
T A 
sen — = sen [7 — arcsen — 
2 Ze 
A 
Jus E DEEM, 
Ze 


Portanto, no ponto de bifurcação 2e = A 
e os dois pontos de equilíbrio são iguais. Para 
desenhar o diagrama de bifurcação, devemos 
traçar o lugar geométrico dos pontos fixos. 
Chamemos de uy = A/2e o parâmetro de bi- 
furcação, então tem-se: 


do(u) = arcsen(u), —1<u<1, 
O-(u) = m-—arcsen(yu), -1<u<1. 


O diagrama de bifurcação da equação de 
Adler (10.20) está mostrado na Figura 10.6. 
Vemos que a bifurcação é do tipo sela-nó. 


O diagrama de bifurcação mostra para 
valores pequnos de | a diferença de fases é 
também pequena. À medida que | aumenta, 
a diferença de fase também aumenta, mas 
chega uma condição limite (o ponto de bi- 
furcação) em que a estabilidade da condição 
síncrona é perdida e os osciladores passam a 
rodar em frequências diferentes. O parâme- 
tro de bifurcação aproxima-se do valor crítico 
Hc = 1 por duas vias: ou aumentando a dife- 
rença entre as frequências naturais dos oscila- 
dortes A, também chamado de descasamento 
ou desajuste de frequências, ou reduzindo a 
“força” do acoplamento e. 


4+ 
3+ R| 
2- 
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FIGURA 10.6: Diagrama de bifurcação. O 
traço contínuo indica o lugar geométrico de 00 
e o pontilhado, o de 0. Para u = A/2e = 1 
ocorre uma bifurcação sela-nó. Para yu > 1 não 
existem pontos fixos e para —1 < u < 1 há dois 
pontos fixos: 09 que é estável e 0,., que é instável. 


10.2.3 O mapa circular 


Um procedimento comumente utilizado nas 
ciências exatas é o de aproximar um sistema 
ou comportamento por um modelo matemá- 
tico simples. Por exemplo, a dinâmica de 
muitos processos industriais, com dezenas de 
componentes e subsistemas, pode ser satisfa- 
toriamente descrita — em torno de uma con- 
dição de operação — por uma função de trans- 
ferência de primeira ordem. Na subseção an- 
terior vimos que o comportamento da dife- 
rença de fase de dois osciladores periódicos 
pode ser descrito pela equação de Adler na 
forma de (10.20). Essa abordagem é muitas 
vezes referida como sendo reducionista. 
Nesta seção seguiremos essa mesma abor- 
dagem para descrever a diferença de fase de 
dois osciladores. Para isso voltaremos a con- 
siderar o cenário ilustrado no Exemplo 4.2.2, 
em que um oscilador com frequência natural 
wo é forçado periodicamente com frequência 


w. Foi visto que esse comportamento pode 
ser descrito por uma trajetória sobre um toro 
T2. No presente estudo deseja-se analisar tal 
trajetória, sobre uma seção de Poincaré P. O 
resultado é um modelo reducionista na forma 
de um mapa, conhecido com mapa circular: 


041 = 0; +Q— > sen (270) (mod 1), (10.23) 


em que (mod 1) significa que retemos so- 
mente a parte decimal do resultado, 0 é o 
ângulo formado na seção de Poincaré P (ver 
Figura 10.7) dado em relação ao círculo, ou 
seja, 90º corresponde a 1/4, 270º, a 3/4 e 
assim por diante. Note que, em (10.23), se 
passarmos o termo 6) para o lado esquerdo da 
equação, ficaremos com a primeira diferença 
de 6, que é uma aproximação da derivada, 
para o caso de grandezas em tempo discreto. 
Sendo assim, logo se percebe que (10.23) cor- 
responde a uma versão em tempo discreto da 
equação de Adler. 


FIGURA 10.7: Trajetória sobre o toro T2 e se- 
ção de Poincaré P. À trajetória sobre o toro T?2 
pode-se associar duas frequências wj e wo. 


A imterpretação do mapa circular é que 
0, é a sequência de ângulos medidos sobre 
P quando um oscilador de frequência natu- 
ral Q é acionado por uma função forçante 
periódica com frequência 27 radianos por re- 
volução. Na nomenclatura do mapa circular 
tem-se que O =wgew=27. 

Desejamos agora analisar dois osciladores 
acoplados entre si. Um tem frequência natu- 
ral w,, o outro, wo. Nesse caso, o comporta- 
mento do sistema composto também pode ser 


visto como uma trajetória sobre um toro T?, 
como ilustrado na Figura 10.7. Como o que 
interessa é a fase entre os osciladores, referen- 
ciaremos uma frequência à outra. Por exem- 
plo, tomando a frequência w, como padrão — 
correspondente à frequência forçante no con- 
texto do Exemplo 4.2.2 — faremos wj=27 e e 
wo é descrita em relação a w, como O=ws /w». 
O próximo exemplo ilustra o uso do mapa 
circular nesse contexto. 


Exemplo 10.2.3 


Suponhamos dois ociladores periódicos 
para os quais wo /w; = 3/4. Neste exem- 
plo consideramos que u = —27, que cor- 
responde a uma amplitude unitária para 
o termo de perturbação em (10.23) com 
fase invertida. Como as frequências não 
são iguais o defasamento entre os oscila- 
dores depende da força do acoplamento 


(1). O mapa que descreve essa situação 
é o mapa circular: 


Os = 0k + - + sen (270) (mod 1). 

(10.24) 

Supondo uma condição inicial do = 

3/4, que correponde a iniciar a trajetória 

no ponto “a” sobre P (ver Figura 10.7), o 

mapa circular (10.24) fornece o ângulo da 

trajetória na próxima vez que ela passar 
por P. Assim 


3 
04 = 00+- 4 + sen (2700) (mod 1) 


4 4 


6 HE 37 
= — n —— = == 
SR > 


que corresponde ao ponto “b” na Fi- 


Do é 
= pat fd (mod 1) 
6 
e 


gura 10.7. As iterações seguintes podem 
ser obtidas de maneira análoga: 


02 = Oy + : + sen (2701) (mod 1) 


los 1 
To + 4 “E sen (25) (mod 1) 


5) 1 
=4 10 (mod 1) =, 


03 =— [15 + - + sen (2705) (mod 1) 


4 
=q + 1 (mod 1)=1, 


ou seja, 05 corresponde ao ponto “c” e 03, 
ao ponto “d” na Figura 10.7. Assim, a 
sequência de ângulos descritos pelo mapa 
(10.24) corresponde à sequência de vi- 
sitação dos pontos a-b-c-d-a-.... Notar 


que a cada quatro revoluções no toro “na 
direção” de w,, a trajetória completa três 
revoluções “na direção” de ws, como ilus- 
trado na Figura 10.8. 


3 
Wa 4 
º — = QN +. a 
TÁ 
GO e 
NE do ce- - us 


wi Ivolta 2voltas 3voltas 4 voltas 


FIGURA 10.8: Relação entre as revoluções 
dadas “nas direções” de wj e wo. Notar que 
os pontos indicados pelas letras a, b, ce d 
encontram-se sobre a seção de Poincaré P. 
Após 4 revoluções na direção de wi, foram 
dadas 3 voltas na direção de w2, o que cor- 
responde a deixar e regressar ao ponto a so- 


bre P. 


Uma outra maneira de mostrar a 
mesma informação, mas no plano, é in- 
dicada na Figura 10.9. A direção corres- 


pondente w, é a vertical. Note que ao 
percorrer o intervalo de O a 27 na “dire- 
ção” da frequência w,, percorre-se 3/4 de 
ciclo na “direção” da frequência wo. Para 
ver isto comece do ponto (w1, w>) = (0,d) 
e vá até (w1,w2) = (27,9). À represen- 
tação utilizada na Figura 10.9 é muito 
utilizada no estudo de sincronismo de os- 
ciladores. 


P uma revolução “na direção” dew, P 


FIGURA 10.9: Trajetória sobre o plano. 
A mesma trajetória sobre o toro T2 da Fi- 
gura 10.7 é mostrada aqui sobre o plano. 
Note a indicação da posição da seção de 
Poincaré P. 


O mapa circular é do tipo 01 = F(0)). 
O comportamento de mapas desse tipo pode 


ser caracterizado por meio de um índice, cha- 
mado de número de rotação: 


(6) — 
is a = 


lim : , (10.25) 


ou seja, W mede o incremento médio no 
ângulo 0 por revolução. Em (10.25), como 
F(09)!*) indica o incremento total depois de 
k revoluções, esse valor deve ser calculado 
sem a operação mod 1 em (10.23). 


Exemplo 10.2.4 


No Exemplo 10.2.3 temos que W = 3/4, 
pois para cada revolução na “direção” de 
w há um incremento de 3/4 no ângulo 6 
— na “direção” de w», como ilustrado na 
Figura 10.8. 


Leitura Recomendada 


Provavelmente o primeiro artigo sobre sincro- 
nismo a atrair grande atenção da comunidade 
foi o de Pecora e Carroll (Pecora e Carroll, 
1990), ainda que não tenha sido nem o pri- 
meiro nem o mais profundo artigo no tema. 


Existem vários tipos de sincronismo (Boc- 
caletti et al., 2002; Osipov et al., 2007). No 
início do desenvolvimento da área o sincro- 
nismo mais comum era o idêntico e a forma 
mais usada para alcançá-lo era o acoplamento 
dissipativo de todas as variáveis (Fujisaka e 
Yamada, 1983). Aproximadamente uma dé- 
cada depois foi mostrado que em algumas 
situações o sincronismo idêntico era alcan- 
çado via o acoplamento de somente uma va- 
riável (Kaplan, 1994). Outro passo impor- 
tante foi o relato do sincronismo de fase, que 
é mais fraco e, por isso, muito mais comum 
que o sincronismo idêntico (Rosenblum et al., 


1996). Foi mostrado que o sincronismo de 
fase é alcançado por meio de acoplamento 
dissipativo fraco de uma variável em oscila- 
dores não idênticos. 


Em algumas aplicações de engenharia o 
que importa é o sincronismo de fase (Pi 
queira, 2011), mas a forma “traditional” de 
acoplar de forma dissipativa ainda é muito 
usada (Kurths et al., 2006; Pereira et al, 
2007). Foi mencionado que esse tipo de co- 
plamento pode não ser eficaz em problemas 
de sincronismo de fase (Belykh et al., 2005; 
Aguirre e Freitas, 2018). 


Um problema importante é a escolha de 
que variável utilizar para realizar o acopla- 
mento. Essa questão ainda não parece ter 
uma definição na literatura. Algumas discus- 
sões preliminares podem ser encontradas em 
(Letellier e Aguirre, 2010; Aguirre e Letellier, 
2016; Sendifia-Nadal et al., 2016; Aguirre e 
Freitas, 2018). 


O tema de sincronismo idêntico foi abor- 
dado por Leonardo Tórres (Tôrres, 2001a) 
e o sincronismo de fase foi investigado por 
Leandro Freitas (Freitas, 2018). Trabalhos 
relacionados são (Tôrres e Aguirre, 2004; 
Tórres, 2007; Leteller e Aguirre, 2010; 
Aguirre e Leteller, 2016; Aguirre e Frei 
tas, 2018; Freitas et al., 2018; Freitas et al., 
2020). Dissertações e teses do PPGEE- 
UFMG estão disponíveis gratuitamente em 
https: //www.ppgee.ufmg.br /bancodefesas.php. 


Exercícios 


10.1. Seguindo o procedimento descrito no 
Exemplo 10.1.1, determine os expoentes de 
Liapunov condicionais para o sistema de Róôs- 
sler, quando as variáveis de acionamento são 
y € 21. 

10.2. Seguindo o procedimento descrito no 
Exemplo 10.1.1, determine os expoentes de 


Liapunov condicionais para o sistema de Lo- 
renz, tomando como variável de acionamento 
cada uma das variáveis de estado do primeiro 
sistema, uma de cada vez. 


10.3. Implemente em código dois oscilado- 
res de Róssler possivelmente acoplados 


t12 =—YWp2— 21,2 + uí a(t) 
n2 =—m2+ano+uLo(t) 
21,2 =b + 212(212 a c) + uí o(t), 


com (a,b,c) = (0,398,2,0, 4,0). 

Inicialmente, usando apenas um oscila- 
dor, investigue a capacidade de sincroniza- 
ção de fase do oscilador a um sinal senoi- 
dal externo da forma u(t) = Asenwt. In- 
vestigue valores de frequência em torno de 
w = 1 (ver abaixo para detalhes). No seu 
estudo, use uma entrada por vez, ou seja, 
u"(t) = u(t), v = 7,y,2 por vez. Use como 


estimativa de fase 4 = tan! (2). Descreva 


que condições utilizou para definir a condição 
síncrona. Lembre-se de desconsiderar o tran- 
siente inicial, que pode ser bastante longo. 

Para definir as faixs [4;; Ar] e [w;; wr] 
proceda como a seguir. Comece sempre com 
A; = 0, que corresponde ao oscilador autô- 
nomo. (Como A deve ser pequeno compa- 
rado ao tamanho do atrator, escolha Ar = 
0,015max|x), ou seja, o maior valor de 4 é 
1,5% da maior dimensão do atrator. Usando 
a FFT, do inglês fast Fourier transform, de- 
termine a frequência fundamental e chame-a 
wo. Os limites da frequência da função for- 
cante podem ser tomados como w; = 0,97wo 
e wr — 1,0300. 

Compare o tamanho do domínio de sin- 
cronização encontrado em cada caso. 


10.4. Classifique o atrator corda com res- 
peito à sua fase, ou seja, se é de fase coerente 
ou não coerente. 


10.5. Mostre que o acoplamento em (10.19) 
corresponde a realimentação negativa e, por- 
tanto, tem ação regulatória. Para isso consi- 
dere pequenos valores de erro de fase. 


10.6. Por meio de simulação numérica, in- 
vestigue a estabilidade de (10.19) para wo = 
le(a) B=2;(b) B = 1/2. Discuta os 
resultados. 
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